哈希表的尴尬

由于cache命中率的原因,哈希表的性能通常是好于红黑树的。即使只有32个元素,红黑树也要进行五次比较,也就是要进行五次随机内存访问。随机内存访问对cpu cache是不太友好的。

但是哈希表有哈希表的尴尬,所以还没一统天下。

hash表最大的缺陷是当数据的量难以估计的时候,没法设置合适的bucket值。
元素可能是10个,也可能是10000个,那么hash表怎么初始化bucket个数。

这里有几种思路:
1,设置缺省的起始bucket个数为100左右,然后让hash表自动扩容。缺点是扩容的时候性能要受影响。
2,结合业务,每次给10000的bucket。缺点是浪费内存,而且无法处理100w这种极端情况。
3,把hash表的list变成哈希表。缺点是结构复杂,多次哈希速度慢。

综合来看,方案1是比较好的折中。



原文地址:https://www.cnblogs.com/hehe520/p/6330376.html