HashMap源码中的resize扩容方法除了扩容还有一个用途你真的知道吗?

前言

点赞在看,养成习惯。

点赞收藏,人生辉煌。

点击关注【微信搜索公众号:编程背锅侠】,防止迷路。

HashMap系列文章

第一篇 HashMap源码中的成员变量你还不懂? 来来来!!!整理好的成员变量源码解析

第二篇 撸啊撸,再次撸HashMap源码,踩坑源码中构造方法!!!每次都有收获

第三篇 MoxiMoxi !!!你看过HashMap中的put方法的源码吗?

第四篇 HashMap源码中的resize扩容方法除了扩容还有一个用途你真的知道吗?

final HashMap.Node<K,V>[] resize()扩容源码

源码解析

final Node<K,V>[] resize() {
    // 成员变量的table赋值给oldTab,就是将扩容前的table赋值给oldTab
    // 第一次添加元素的时候oldTab = table=null,再次添加的时候oldTab = table为添加之前的table数组
    Node<K,V>[] oldTab = table;
    // 记录Map当前的容量
    // 如果当前数组等于null长度返回0,否则返回当前数组的长度
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    // 记录Map允许存储的元素数量,即阈值(容量*负载因子),超过这个阀值要扩容 
    // 首次添加元素的时候初始化容量这个oldThr=threshold=0,再次添加元素的时候会将当前的扩容阀值赋值给oldThr
    int oldThr = threshold;
    // 声明两个变量,用来记录新的容量和阈值
    int newCap, newThr = 0;
    // 若当前容量不为0,表示存储数据的数组已经被初始化过
    if (oldCap > 0) {
        // 判断当前容量是否超过了允许的最大容量
        if (oldCap >= MAXIMUM_CAPACITY) {
            // 若超过最大容量,表示无法再进行扩容
            // 则更新当前的阈值为int的最大值,并返回旧数组
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 将旧容量*2得到新容量,若新容量未超过最大容量值,并且旧容量大于默认初始容量(16),才则将旧阈值*2得到新阈值
        // 在以前的扩容阀值的基础上翻倍,假如以前的数组长度16 扩容阀值为 16*0.75=12
        // 扩容新的容量为之前的容量的2倍newCap = oldCap << 1 左移一位 原来的大小为 16 扩容以后位32  以此类推
        // 新的扩容阀值也为原来的2倍 newThr = oldThr << 1; 左移动1位  原来的扩容阀值为12 现在的阀值为24  以此类推
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            // 将旧阈值*2得到新阈值
            newThr = oldThr << 1; // double threshold
    }
    // 若不满足上面的oldCap > 0,表示数组还未初始化,
    // 若当前阈值不为0,就将数组的新容量记录为当前的阈值;
    // 为什么这里的oldThr在未初始化数组的时候就有值呢?
    // 这是因为HashMap有两个带参构造器,可以指定初始容量,
    // 若你调用了这两个可以指定初始容量的构造器,
    // 这两个构造器就会将阈值记录为第一个大于等于你指定容量,且满足2^n的数(可以看看这两个构造器)
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    // 若上面的条件都不满足,表示你是调用默认构造器创建的HashMap,且还没有初始化table数组
    else {               // zero initial threshold signifies using defaults
        // 则将新容量更新为默认初始容量(16)
        // 阈值即为(容量*负载因子)12
        // 初始化容量会走这个
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    // 经过上面的步骤后,newCap一定有值,但是若运行的是上面的第二个分支时,newThr还是0
    // 所以若当前newThr还是0,则计算出它的值(容量*负载因子)
    if (newThr == 0) {
        // 再次扩容的阀值
        float ft = (float)newCap * loadFactor;
        // 获取新的阀值,小于最大容量就为上面计算的扩容阀值,否则为Integer.MAX_VALUE
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    // 将计算出的新阈值更新到成员变量threshold上
    // 第一次添加的时候初始化threshold = newThr = 12
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
    // 创建一个记录新数组用来存HashMap中的元素,容量为新的容量newCap
    // 若数组不是第一次初始化,则这里就是创建了一个两倍大小的新数组
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    // 将新的的数组赋值给成员变量table
    table = newTab;
    // 判断旧数组是否等于空,不等于null开始将原来的数据加入到新数组中
    if (oldTab != null) {
        // 遍历原数组。把每个bucket都移动到新的bucket中,遍历旧的哈希表的每个桶,重新计算桶里元素的新位置
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            // 若原数组的j位置有节点存在,才进一步操作
            if ((e = oldTab[j]) != null) {
                // 清除旧数组对节点的引用,方便垃圾回收
                oldTab[j] = null;
                // 若table数组的j位置只有一个节点,则直接将这个节点放入新数组,位置可能在新的之前的位置也肯能在旧的容量加上旧的位置
                // 使用 & 替代 % 计算出余数,即下标
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                // 若第一个节点是一个树节点,表示原数组这个位置的链表已经被转为了红黑树
                // 则调用红黑树的方法将节点加入到新数组中    
                else if (e instanceof TreeNode)
                    // 将红黑树进行拆分
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                // 上面两种情况都不满足,表示这个位置是一条不止一个节点的链表
                // 接下来将原数组中的每一条链表的节点,放入到扩容后的新数组中
                // 原数组中一条链表上的所有节点,若将它们加入到扩容后的新数组中,它们最多将会分布在新数组中的两条链表上
                else { // preserve order
                    // 创建两个头尾节点,表示两条链表
                    // 因为旧链表上的元素放入新数组中,最多将变成两条链表
                    // 一条下标不变的链表,一条下标+oldCap
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    // 循环遍历原链表上的每一个节点
                    do {
                        // 记录当前节点的下一个节点
                        next = e.next;
                        // 注意:e.hash & oldCap这一步就是前面说的判断多出的这一位是否为1
                        // 若与原容量做与运算,结果为0,表示将这个节点放入到新数组中,下标不变
                        if ((e.hash & oldCap) == 0) {
                            // 若这是不变链表的第一个节点,用loHead记录
                            if (loTail == null)
                                loHead = e;
                            // 否则,将它加入下标不变链表的尾部    
                            else    
                                loTail.next = e;
                            // 更新尾部指针指向新加入的节点    
                            loTail = e;
                        }
                        // 若与原容量做与运算,结果为1,表示将这个节点放入到新数组中,下标将改变
                        else {
                            // 若这是改变下标链表的第一个节点,用hiHead记录
                            if (hiTail == null)
                                hiHead = e;
                            // 否则,将它加入改变下标链表的尾部    
                            else
                                hiTail.next = e;
                            // 更新尾部指针指向新加入的节点    
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 所有节点遍历完后,判断下标不变的链表是否有节点在其中
                    if (loTail != null) {
                        // 将这条链表的最后一个节点的next指向null
                        loTail.next = null;
                        // 同时将其放入新数组的相同位置
                        newTab[j] = loHead;
                    }
                    // 另一条链表与上同理
                    if (hiTail != null) {
                        hiTail.next = null;
                        // 这条链表放入的位置要在原来的基础上加上oldCap
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

概括总结

这个resize扩容方法有两个作用。

  • 首次添加元素的时候,执行的resize方法是初始化数组。
  • 再次添加的元素,如果容量达到了扩容的阀值,需要进行扩容,执行的是扩容。

面试总结

HashMap什么时候才需要扩容?

当HashMap中的元素个数超过数组⼤小(数组⻓度)*loadFactor(负载因子)时,就会进行数组扩容, loadFactor的默认值(DEFAULT_LOAD_FACTOR)是0.75,这是⼀个折中的取值。也就是说,默认情况下, 数组⼤⼩为16,那么当HashMap中的元素个数超过16×0.75=12(这个值就是阈值或者边界值threshold 值)的时候,就把数组的⼤小扩展为2×16=32,即扩⼤一倍,然后重新计算每个元素在数组中的位置,⽽这是一个⾮常耗性能的操作,所以如果我们已经预知HashMap中元素的个数,我们可以创建一个预知大小的集合,那么预知元素的个数能够有效的提高HashMap的性能。

HashMap中的其中一个链表的对象个数如果达到了8个,此时如果数组长度没有达到64,那么 HashMap会先扩容解决,如果已经达到了了64,那么这个链表会变成红黑树,节点类型由Node变成 TreeNode类型。当然,如果映射关系被移除后,下次执行resize⽅法时判断树的节点个数低于6,也会再把树转换为链表。

进⾏扩容,会伴随着一次重新hash分配,存放位置变化了吗?

进行扩容,会伴随着一次重新hash分配,并且会遍历hash表中所有的元素,是⾮常耗时的。在编写程序中,要尽量避免resize。

HashMap在进行扩容时,使⽤的rehash⽅式非常巧妙,因为每次扩容都是翻倍,与原来计算的 (n- 1)&hash的结果相比,只是多了一个bit位,所以节点要么就在原来的位置,要么就被分配到"原位置**+**旧容量"这个位置。

位置变换详解

&与运算和^异或运算
&与运算
运算规则:相同的二进制数位上,都是1的时候,结果为1,否则为零。
案例:5 & 11 = 1
	5   0101
&	11  1011
………………………………
结果: 0001【运算结果:1】
^异或运算
运算规则:相同的二进制数位上,数字相同,结果为0,不同为1。
案例:5 ^ 11 = 14
	5   0101
^	11  1011
………………………………
结果: 1110【运算结果:14】
(h = key.hashCode()) ^ (h >>> 16)演示
h = key.hashCode(): 1111 1111 1111 1111 1111 1010 1100 1010      这个值代表哈希code值
………………………………………………………………………………………………………………………………………………………………………………………………………………………………
						h	: 1111 1111 1111 1111 1111 1010 1100 1010
					h >>>16 : 0000 0000 0000 0000 1111 1111 1111 1111 
		      h ^ (h >>> 16): 1111 1111 1111 1111 0000 0101 0011 0101
………………………………………………………………………………………………………………………………………………………………………………………………………………………………
(n - 1)&hash计算的是在集合中的插入桶的位置
						 n - 1: 0000 0000 0000 0000 0000 0000 0000 1111【假设的容量为16-1=15】
						  hash:	1111 1111 1111 1111 0000 0101 0011 0101【这个是上面高16位和低16位异或得到的】
			       &与运算的结果:	0000 0000 0000 0000 0000 0000 0000 0101  =>[5]
………………………………………………………………………………………………………………………………………………………………………………………………………………………………
【重点】假如现在扩容,这个容量变为了32,那么上面计算的索引为5,到扩容后的集合的位置可能是5或者是21

(n - 1)&hash计算的是在集合中的插入桶的位置
						 n - 1: 0000 0000 0000 0000 0000 0000 0001 1111【假设的容量为32-1=31】
						  hash:	1111 1111 1111 1111 0000 0101 0011 0101【这个是上面高16位和低16位异或得到的】
			       &与运算的结果:	0000 0000 0000 0000 0000 0000 0001 0101  =>[21]
                假如hash位置为0 :                                  0       =>[5]
………………………………………………………………………………………………………………………………………………………………………………………………………………………………
扩容以后,上面计算得到的便是可能在原来的位置5上,也可能在在新的位置21上。

谢谢点赞

  • 创作不易, 非常欢迎大家的点赞、评论和关注(^_−)☆
  • 你的点赞、评论以及关注是对我最大的支持和鼓励,而你的支持和鼓励
  • 我继续创作高质量博客的动力 !!!

猜你喜欢

转载自blog.csdn.net/wildwolf_001/article/details/107235699
今日推荐