数据结构（十二）散列表

定义

以下简称hahs

应用场景

适合查找与给定值相同的数据，不适合做范围查找，1对多映射查找

问题

冲突，散列表的理论依据是每个不同的关键字通过散列算法得到的结果都是唯一的，而现实中有可能出现几个结果相同的关键字。

hash算法

构造一个散列算法考虑几个方面

直接定址法

按如下公式计算出关键字的hash值，当原始的key不重复，则得到的hash值就不会冲突

数字分析法

抽取关键字的一部分作为hash值

例如手机号，一般可以取后4位或者后4位的变形作为hash值，（公司内部场景）

平方取中法

折叠法

除留余数法

随机数法

java针对stirng的hash算法

hash = 31 * hash + str[i];

其中str[i]表示string的某个位置字符

至于为什么用31那。首先你必须使用一个质数，那又会问，为什么要用质数呢，如果你使用一个有因数的数，那么相乘得到的结果会出现更多的hash冲突。那为什么选择31呢，i*31== (i<<5)-1，可以被编译器优化为移位计算，那为什么不选7呢，i*7==(i<<3)-1，系数尽可能大也可以减少hash冲突，但是太大相乘可能会导致溢出，所以31是一个折中的系数。详细可以参考这个解释

https://stackoverflow.com/questions/299304/why-does-javas-hashcode-in-string-use-31-as-a-multiplier