哈希容器

hashtable

将一系列数放入容器中,将数除以内存的大小M,得到的余数挂在每个篮子下面。篮子的个数M一般取质数,当篮子所挂的链表长度大于篮子个数M时,就要rehashing,扩充篮子的数量(vector二倍扩充,不过扩充以后选取2*M附近的质数)

开链法

hashtable的桶子(buckets)与节点(nodes)

hash table表格内的元素为桶子(bucket),此名称的大约意义是:表格内的每个单元,涵盖的不只是个节点(元素),甚至可能是一桶节点。

haah table的图示


buckets vector大小为任意常数,虽然list是线性搜寻时间,如果list够小,搜寻速度仍然很快。

GC编译器将bucket的个数设置为53,当桶中元素的个数大于bucket的个数时,就需要对放置桶的vector进行扩容,我们可以使用hashtable iterators改变元素的data,但不能改变元素的key.

hashtable实现

  • HashFcn : 是hash函数
  • ExtractKey: 插入的元素是一包东西,可能是一个pair,必须要告诉如何取出这个key
  • EqualKey: 如何对key进行判等
template <class Value, class Key, class HashFcn,
		  class ExtractKey, class EqualKey,
		  class Alloc = alloc>
	class hashtable {
	public:
		typedef HashFcn  hasher; //hash函数
		typedef EqualKey key_equal; //判等函数
		typedef size_t size_type;
	private:
		hasher hash; //大小为0,但是实际值为1
		key_equal equals;//大小为0,但是实际值为1
		ExtractKey get_key;//大小为0,但是实际值为1
		typedef __hashtable_node<Value>node;
		vector<node*, Alloc>buckets; // vector里有三个指针,大小为12
		size_type num_elements;//4个字节
	public:
		size_type bucket_count() const { return bucket.size(); }
};
  • hashtable总共大小是19个字节,调整为4的倍数,一共是20个字节。

hashtable的节点实现

其中node节点的设置如下:

template<class Value>
struct __hashtable_node {
    __hashtable_node * next;
    Value val;
};

除了需要保存数据本身之外,还需要一个指针去指向下一个元素。

hashtable的迭代器实现

struct __hashtable_iterator {
    node* cur;
    hashtable* ht;
};

hashfunction的设计

hashfunction的目的是:希望能够根据元素的值计算出一个hashcode,使得元素经过hash code映射之后,能够被随机的放置于hashtable中,越是够乱,越不容易产生碰撞。

unordered_set

原文地址:https://www.cnblogs.com/ccpang/p/12284018.html