hashmap详解（基于jdk1.8）

简介：

在jdk1.8中，hashmap有了较大的优化，底层实现由之前的“数组+链表”改为了“数组+链表+红黑树”。jdk1.8的hashmap的数据结构如图所示，当链表节点较少时仍然以链表形式存在，当链表节点较多时（大于8）会转化为红黑树。

重要知识点：

1、文章中头节点指的是table表上索引位置的节点，也就是链表的头结点

2、根节点（root）指的是红黑树最上面的节点，也就是没有父节点的节点

3、红黑树的根节点不一定是索引位置的头结点（链表的头结点），hashmap通过moveRootToFront方法来维持红黑树的根节点就是索引位置的头结点，但是在removeTreeNode方法中，当movable为false时，不会调用moveRootToFront方法，此时红黑树的根节点不一定是索引位置的头结点，该情形发生在hashIterator的remove方法中

4、转为红黑树之后，链表的结构还存在，通过next属性维持，红黑树节点在进行操作时都会维护链表的结构，并不是转化为红黑树节点，链表结构就不存在了

5、在红黑树上，叶子节点也可能有next节点，因为红黑树的结构与链表的结构是互不影响的，不会因为是叶子节点就说该节点已经没有next节点

6、源码中的一些变量的定义为：如果定义了一个节点p，则pl（p left）为p的左节点，pr（p right）为p的右节点，pp（p parent）为p的父节点，ph（p hash）为p的hash值，pk（p key）为p的key值，kc（key class）为key的类等等。

7、链表中移除一个节点只需要如图的操作

8、红黑树在维护链表结构时，移除一个节点只需要如图所示操作（红黑树中增加了一个prev属性），其他操作同理。注：此处只是红黑树维护链表结构的操作，红黑树还需要单独进行红黑树的移除或者其他操作

9、源码中进行红黑树的查找时，会反复使用两条规则：1）如果目标节点的hash值小与p节点的hash值，则向p节点的左边遍历；否则向p节点的右边遍历。2）如果目标节点的key值小与p节点的key值，则向p节点的左边遍历；否则向p节点的右边遍历。这两条规则是利用了红黑树的特性（左节点<根节点<右节点）

10、源码中进行红黑树的查找时，会用dir（direction）来表示向左还是向右查找，dir存储的值是目标节点的hash/key与p节点的hash/key的比较结果

基本属性：

// 默认容量16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 
 
// 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;    
 
// 默认负载因子0.75
static final float DEFAULT_LOAD_FACTOR = 0.75f; 
 
// 链表节点转换红黑树节点的阈值, 9个节点转
static final int TREEIFY_THRESHOLD = 8; 
 
// 红黑树节点转换链表节点的阈值, 6个节点转
static final int UNTREEIFY_THRESHOLD = 6;   
 
// 转红黑树时, table的最小长度
static final int MIN_TREEIFY_CAPACITY = 64; 
 
// 链表节点, 继承自Entry
static class Node<K,V> implements Map.Entry<K,V> {  
    final int hash;
    final K key;
    V value;
    Node<K,V> next;
 
    // ... ...
}
 
// 红黑树节点
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
    TreeNode<K,V> parent;  // red-black tree links
    TreeNode<K,V> left;
    TreeNode<K,V> right;
    TreeNode<K,V> prev;    // needed to unlink next upon deletion
    boolean red;
   
    // ...
}

定位哈希桶数组索引位置

由于HashMap的数据结构为“数组+链表+红黑树”的组合，所以我们希望这个HashMap里面的元素位置尽量分布地更加均匀，尽量使得每个位置上的元素数量只有一个，那么当我们用hash算法求得这个位置的时候，马上就可以知道对应位置的元素就是我们要的，不用遍历链表/红黑树，大大优化了查询的效率。HashMap定位数组索引的位置，直接决定了hash方法的离散性能。源码为：

// 代码1
static final int hash(Object key) { // 计算key的hash值
    int h;
    // 1.先拿到key的hashCode值; 2.将hashCode的高16位参与运算
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
// 代码2
int n = tab.length;
// 将(tab.length - 1) 与 hash值进行&运算
int index = (n - 1) & hash;

1、拿到key的hashCode值

2、将hashCode的高位参与运算，重新计算hash值

3、将计算出来的hash值于（table.length-1)进行&运算

解读：对于任意给定的对象，只要他的hashCode()返回值相同，那么计算得到的hash值总是相同的。把hash值对table长度取模运算，这样一来，元素的分布相对来说是比较均匀的。

但是模运算的消耗比较大，计算机中的位运算比较快，因此使用代码2的位与运算来代替模运算。他通过(table.length-1)&h来获得该对象的索引位置。

在JDK1.8的实现中，还优化了高位运算的算法，将hashCode的高16位与hashCode进行异或运算，主要是为了在table的长度较小的时候，让高位也参与运算，并且不会有太大的开销。

例子：

当table的长度为16时，table.length-1=15，在二进制中，此时低四位全部为1，高28位全部为0，当0进行&运算时结果必然为0，因此此时hashCode与“table.length-1”的&运算只取决于hashCode的低四位，在这种情况下，hashCode的高28位就没起到任何作用，并且由于hash结果只取决于hashCode的低4位，hash冲突的概率也会增加。因此，在JDK1.8中，将高位也参与计算，目的是为了降低hash冲突的概率。

get方法：

public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}
 
final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    // 1.对table进行校验：table不为空 && table长度大于0 && 
    // table索引位置(使用table.length - 1和hash值进行位与运算)的节点不为空
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        // 2.检查first节点的hash值和key是否和入参的一样，如果一样则first即为目标节点，直接返回first节点
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        // 3.如果first不是目标节点，并且first的next节点不为空则继续遍历
        if ((e = first.next) != null) {
            if (first instanceof TreeNode)
                // 4.如果是红黑树节点，则调用红黑树的查找目标节点方法getTreeNode
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            do {
                // 5.执行链表节点的查找，向下遍历链表, 直至找到节点的key和入参的key相等时,返回该节点
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    // 6.找不到符合的返回空
    return null;
}

4.如果是红黑树节点，则调用红黑树的查找目标节点方法 getTreeNode。

final TreeNode<K,V> getTreeNode(int h, Object k) {
    // 1.首先找到红黑树的根节点；2.使用根节点调用find方法
    return ((parent != null) ? root() : this).find(h, k, null);
}

2.使用根节点调用 find 方法。

/**
 * 从调用此方法的节点开始查找, 通过hash值和key找到对应的节点
 * 此方法是红黑树节点的查找, 红黑树是特殊的自平衡二叉查找树
 * 平衡二叉查找树的特点：左节点<根节点<右节点
 */
final TreeNode<K,V> find(int h, Object k, Class<?> kc) {
    // 1.将p节点赋值为调用此方法的节点，即为红黑树根节点
    TreeNode<K,V> p = this;
    // 2.从p节点开始向下遍历
    do {
        int ph, dir; K pk;
        TreeNode<K,V> pl = p.left, pr = p.right, q;
        // 3.如果传入的hash值小于p节点的hash值，则往p节点的左边遍历
        if ((ph = p.hash) > h)
            p = pl;
        else if (ph < h) // 4.如果传入的hash值大于p节点的hash值，则往p节点的右边遍历
            p = pr;
        // 5.如果传入的hash值和key值等于p节点的hash值和key值,则p节点为目标节点,返回p节点
        else if ((pk = p.key) == k || (k != null && k.equals(pk)))
            return p;
        else if (pl == null)    // 6.p节点的左节点为空则将向右遍历
            p = pr;
        else if (pr == null)    // 7.p节点的右节点为空则向左遍历
            p = pl;
        // 8.将p节点与k进行比较
        else if ((kc != null ||
                  (kc = comparableClassFor(k)) != null) && // 8.1 kc不为空代表k实现了Comparable
                 (dir = compareComparables(kc, k, pk)) != 0)// 8.2 k<pk则dir<0, k>pk则dir>0
            // 8.3 k<pk则向左遍历(p赋值为p的左节点), 否则向右遍历
            p = (dir < 0) ? pl : pr;
        // 9.代码走到此处, 代表key所属类没有实现Comparable, 直接指定向p的右边遍历
        else if ((q = pr.find(h, k, kc)) != null) 
            return q;
        // 10.代码走到此处代表“pr.find(h, k, kc)”为空, 因此直接向左遍历
        else
            p = pl;
    } while (p != null);
    return null;
}

明天再写