HashMap的自定义实现

一、背景:          

HashMap到底是怎么实现的?
一对一对的存放,通过key找value;map的键不能重复;自己怎么实现呢?
 
代码:
Wife.java  辅助类
package com.cy.collection;

public class Wife {
    String name;
    
    public Wife(String name){
        this.name = name;
    }

    @Override
    public String toString() {
        return "Wife [name=" + name + "]";
    }
}
View Code

Map.java:

package com.cy.collection;

/**
 * 自定义实现Map
 */
public class Map {
    private Entry[] arr = new Entry[1000];    //这里暂时不考虑扩容
    private int size;                        //这里都是private的,不暴露size属性
    
    /**
     * 1.键不能重复,如果含有这个键,就替换value
     * @param key
     * @param value
     */
    public void put(Object key, Object value){
        for(int i=0; i<size; i++){
            if(arr[i].key.equals(key)){
                arr[i].value = value;
                return;
            }
        }
        arr[size++] = new Entry(key, value);
    }
    
    //根据key获取
    public Object get(Object key){
        for(int i=0; i<size; i++){
            if(arr[i].key.equals(key)){
                return arr[i].value;
            }
        }
        return null;
    }
    
    //根据key删除
    public boolean remove(Object key){
        boolean success = false;
        for(int i=0;i<size;i++){
            if(arr[i].key.equals(key)){
                success = true;
                remove(i);
            }
        }
        return success;
    }
    private void remove(int i){
        int numMoved = size - i - 1;
        if(numMoved>0){
            System.arraycopy(arr, i+1, arr, i, numMoved);
        }
        arr[--size] = null;        //Let gc do its work
    }
    
    //containsKey
    public boolean containsKey(Object key){
        for(int i=0; i<size; i++){
            if(arr[i].key.equals(key)){
                return true;
            }
        }
        return false;
    }
    
    //containsValue 同containsKey
    
    //size
    public int size(){
        return size;
    }
}

/**
 * 用来存放键值对的条目
 */
class Entry{
    Object key;
    Object value;
    
    public Entry(Object key, Object value) {
        super();
        this.key = key;
        this.value = value;
    }
}

Test.java测试代码:

package com.cy.collection;

public class Test {

    public static void main(String[] args) {
        Map map = new Map();
        map.put("张三", new Wife("abc"));
        map.put("李四", new Wife("def"));
        map.put("王五", new Wife("ghi"));
        System.out.println(map.get("张三"));
        map.remove("李四");
        System.out.println(map.size());
        
        map.put("张三", new Wife("aaa"));
        System.out.println(map.get("张三"));
        System.out.println(map.containsKey("张三"));
    }

}

输出:
Wife [name=abc]
2
Wife [name=aaa]
true
View Code
虽然说实现了,但是上面Map不完美的地方:
1.每次get(key)都要遍历数组一次,效率很低;
 
有没有什么办法可以让查询的效率高起来?
 

 二、map改进,哈希算法实现,使用数组和链表    

能不能通过什么方法来提高查询效率?避免像上面的map一样循环遍历?能不能有好的办法一下子就命中目标。
思路:
1)假如arr数组是无穷大的,现在要将一个key放进数组,先计算key.hashCode(),将hashCode值就放在arr数组的这个对应下标的位置,
即arr[key.hashCode]这个位置,这个位置就存放Entry(key,value)。下次再要查找get(key)的时候,计算key的hashCode值,然后从数组中
找到arr[key.hashCode]不就快速定位,拿出来了吗?
2)但是,数组不是无穷大的,现在能不能将key的hashCode进行转化,转化成一个合理的数,比如arr[1000],数组的下标就是0~1000,能不能将hashCode
转化为0~1000的一个数,这样就可以放到对应下标值的位置上啦。
3)怎么转换?hashCode%1000,来取余数,余数的范围就是0-999,要放的键值对就放在arr[余数];
但是余数极大可能会重复,怎么办?
4)Map的底层实现是数组+链表,现在数组里面不存放Entry对象,而是存放链表,如果余数相同,就在链表的后面继续添加;
get(key)的时候,就在这个数组的位置arr(key.hashCode)上,查找这个链表,在遍历;
 
图示:
 
 
代码:
Map.java:
package com.cy.collection;

import java.util.LinkedList;

/**
 * 自定义实现Map升级版
 * 1.提高查询的效率
 */
public class Map {
    private LinkedList[] arr = new LinkedList[1000];    //Map的底层结构就是:数组+链表
    private int size;            
    
    /**
     * 1.键不能重复,如果含有这个键,就替换value
     */
    public void put(Object key, Object value){
        Entry e = new Entry(key, value);
    
     int hash = key.hashCode();
     hash = hash<0?-hash:hash;
        int a = hash % arr.length;
        
        if(arr[a]==null){
            LinkedList list = new LinkedList();
            arr[a] = list;
            list.add(e);
        }else{
            LinkedList list = arr[a];
            for(int i=0; i<list.size(); i++){
                Entry en = (Entry) list.get(i);
                if(en.key.equals(key)){
                    en.value = value;            //键值重复,覆盖value
                    return;
                }
            }
            list.add(e);
        }
        size++;
    }
    
    //根据key获取值
    public Object get(Object key){
        int a = key.hashCode() % arr.length;
        if(arr[a]!=null){
            LinkedList list = arr[a];
            for(int i=0; i<list.size(); i++){
                Entry e = (Entry) list.get(i);
                if(e.key.equals(key)){
                    return e.value;
                }
            }
        }
        return null;
    }
    
    //size
    public int size(){
        return size;
    }
}

/**
 * 用来存放键值对的条目
 */
class Entry{
    Object key;
    Object value;
    
    public Entry(Object key, Object value) {
        super();
        this.key = key;
        this.value = value;
    }
}

Test.java

package com.cy.collection;

public class Test {

    public static void main(String[] args) {
        Map map = new Map();
        map.put("张三", new Wife("abc"));
        map.put("李四", new Wife("def"));
        map.put("张三", new Wife("ghi"));
        System.out.println(map.get("张三"));
        System.out.println(map.size());
    }
    
    
}

输出:
Wife [name=ghi]
2
View Code
 
 三、小结          
1.哈希算法的本质:通过这个算法,可以快速的定位元素在数组中的存储位置;
2.从上面代码可以看到,如果两个obj互相equals了,那么他们的hashCode必然相等。
3.Object类的hashCode方法为:public native int hashCode();没有实现,native表示本地的,调用本地的一些资源,和操作系统相关的,hashCode默认的实现是根据内存地址进行计算的,native,跟操作系统相关的一种本地方法;
 
 
原文地址:https://www.cnblogs.com/tenWood/p/9180541.html