hashMap源码理解和运用

在Java中每一个对象都有一个哈希码，这个值可以通过hashCode()方法获得。hashCode()的值和对象的equals方法息息相关，是两个对象的值是否相等的依据，所以当我们覆盖一个类的equals方法的时候也必须覆盖hashCode方法，HashMap可以看作是Java实现的哈希表。HashMap中存放的是key-value对，对应的类型为java.util.HashMap.Entry，所以在HashMap中数据都存放在一个Entry引用类型的数组table中。这里key是一个对象，为了把对象映射到table中的一个位置，我们可以通过求余法来，所以我们可以使用 [key的hashCode % table的长度]来计算位置（当然在实际操作的时候由于需要考虑table上的key的均匀分布可能需要对key的hashCode做一些处理）。
相关属性首先肯定是需要一个数组table，作为数据结构的骨干。

transient Entry[] table;
static class Entry<K,V> implements Map.Entry<K,V>{

final K key;

V value;

Entry<K,V> next;

final int hash;
......

这边定义了一个Entry数组的引用。继续介绍几个概念把
capacity容量是指数组table的长度
loadFactor 装载因子，是实际存放量/capacity容量的一个比值，在代码中这个属性是描述了装载因子的最大值，默认大小为0.75
threshold（阈值）代表hashmap存放内容数量的一个临界点， 当存放量大于这个值的时候，就需要将table进行夸张，也就是新建一个两倍大的数组，并将老的元素转移过去。threshold = (int)(capacity * loadFactor);

put方法详解

  public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key.hashCode());
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

考虑哈希表要添加一个元素，现在假设前提是某个Entry的hash值已经计算出来，那么我们都知道哈希表下一步就是根据这个hash值

把Entry放在table数组的某个位置。我们首先想到的就是把hash值对数组长度取模运算，这样一来，元素的分布相对来说是比较均匀的。但是，“模”运算的消耗还是比较大。我们看一下Java的牛人是怎么写的。Java源码中indexFor(int h, int length) 方法用来计算某Entry对象应该保存在 table 数组的哪个索引处，其代码如下：

static int indexFor(int h, int length) {
return h & (length-1);
}

这个方法简单而又非常巧妙，它通过 h & (table.length -1) 来得到该对象的保存位，而HashMap底层数组的长度总是 2 的 n 次方，这里就是HashMap在速度上优化的一个点。在 HashMap 构造器中有如下代码：

int capacity = 1;
   while (capacity < initialCapacity)
        capacity <<= 1;
   这段代码保证初始化时HashMap的容量总是2的n次方，即底层数组的长度总是为2的n次方。
当length总是 2 的n次方时，h& (length-1)运算等价于对length取模，也就是h%length，但是&比%具有更高的效率。

    void addEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
        table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
        if (size++ >= threshold)
            resize(2 * table.length);
    }

get方法

   public V get(Object key) {
        if (key == null)
            return getForNullKey();
        int hash = hash(key.hashCode());
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }

get方法其实就是将key以put时相同的方法算出在table的所在位置，然后对所在位置的链表进行遍历，找到hash值和key都相等的Entry并将value返回。

Map遍历效率问题

    
//方法一
void printMap(Map<String,Object> map){
    	Iterator<?> iterator = map.entrySet().iterator();
    	while(iterator.hasNext()){
    		@SuppressWarnings("unchecked")
			Entry<String,Object> entry = (Entry<String,Object>)iterator.next();
    		System.out.println("key=  "+entry.getKey()+" value= "+entry.getValue());
    	}   
   }
  //方法二  
    void printMap1(Map<String,Object> map){
    	Iterator<String> iterator = map.keySet().iterator();
    	while(iterator.hasNext()){
    		Object key = iterator.next();
    		System.out.println("key= "+key+" value= "+map.get(key) );
    	}	
    }
    //方法三
    void printMap2(Map<String,Object> map){
    	for(Map.Entry<String, Object> entry:map.entrySet()){
    		System.out.println("key= "+entry.getKey()+"; value="+entry.getValue());
    	}

请用方法一和三，其实方法二遍历了两遍map 严重影响效率

hashMap源码理解和运用

猜你喜欢