散列表学习笔记(HashTable)

散列表在实际应用中比较多，也是各种面试中出现频率比较高的内容（一般都是考你如何应用）。

散列表是实现字典操作的一种有效数据结构，其最突出的是查找性能，在一些合理的假设下，散列表中查找的平均时间为O(1)。下面介绍几种常见的散列表。

直接寻址表（适用于关键字的全域U比较小的情况）

直接寻址表就是一个数组，其为每一个可能的关键字提供位置，每个位置对应于全域中的一个关键字（可以讲一一对应）。对于直接寻址表，字典操作都是常数时间内完成（插入，查询，删除）。直接寻址表中存储的内容包括: 用来确定某个槽是否为空的标记（可以为关键字本身）和卫星数据（非必要）。

直接寻址表的缺点是有可能浪费空间，比如在实际存储的关键字个数比所有可能的关键字总数小时，而且实际上有可能没有那么多的空间来为每一个可能的关键字都分配一个位置。散列表是片普通数组的推广，但是它是根据关键字计算出相应的下标。由于不在为每一个可能的关键字分配空间，所以可能会存在冲突，即多个关键字映射到同一个位置。

如何得到性能良好的散列表呢？

1) 选择尽可能好的散列函数

除法散列法：选择一个尽可能大的素数且距离2的幂较远

乘法散列法：关键字乘上一个0到1之间的数，提出乘积的小数部分，然后用散列表大小乘以这个小数并向下取整。这里A的选取比较关键，Knuth建议使用2 654 435 769/4 294 967 296

$h(k)=left lfloor m(kA mod 1)) ight floor$