&11,散列表

#1,是什么?

散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。

给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。

#2,散列函数

一般的线性表,树中,记录在结构中的相对位置是随机的,即和记录的关键字之间不存在确定的关系,因此,在结构中查找记录时需进行一系列和关键字的比较。这一类查找方法建立在“比较“的基础上,查找的效率依赖于查找过程中所进行的比较次数。 理想的情况是能直接找到需要的记录,因此必须在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使每个关键字和结构中一个唯一的存储位置相对应。

简言之,散列函数就是给一个映射关系,左边连接的是元素,右边连接的是存储元素的数组地址。我们能通过给出的元素关键值key,找到它在数组中的存储地址。根据函数的性质,可能会存在不同的关键值key,但是映射到数组中的同一个地址,称之为冲突,也叫hash冲突。

hash函数类型【方法】:

  直接定址法:散列函数取的是关键字本身。

  数字分析法:尽量平均分布,减少冲突,所以要选有“代表性”的数字。

  平方取中法:关键字平方之后取中间的一位或者多位。

  折叠法:将关键字按位分成几份,叠加后取相同较少的位。

  除留余数法:取不大于数组长度的某个值,除关键字后取余数。

  随机数法:选择一个随机函数,作用于关键字。

#3,散列冲突

虽然我们不希望发生冲突,但实际上发生冲突的可能性仍是存在的。当关键字值域远大于哈希表的长度,而且事先并不知道关键字的具体取值时。冲突就难免会发 生。另外,当关键字的实际取值大于哈希表的长度时,而且表中已装满了记录,如果插入一个新记录,不仅发生冲突,而且还会发生溢出。因此,处理冲突和溢出是 哈希技术中的两个重要问题。

冲突处理方法:

  链表法:将处于同一位置的不同元素用一个单链表串联起来。

  开放定址法:当冲突产生时,使用某种关系,一直给元素找到没有冲突的位置位置。找这种关系称之为探查,可以分为线性探查法、线性补偿探测法、随机探测。

#4,判断优劣

对散列表的reserch,insert,delete的时间复杂度来衡量散列函数和散列冲突处理方法的优劣。

原文地址:https://www.cnblogs.com/sophia-hxw/p/5713450.html