Java并发编程之ConcurrentHashMap原理解析

ConcurrentHashMap

  1. get:

    /**
     *  根据键值key获取value,根据key.equals方法判断两个元素是否相同
     *  @param key 键
     *  @return 如果key存在则返回对应的value,否则返回null
     */
    public V get(Object key) {
          
          
        Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
        //将key的hashcode进一步散列,减少hash碰撞
        int h = spread(key.hashCode());
        //具体的元素信息是存在Node[]数组中,先判断key对应hash值映射到数组元素的位置释放有值
        //如果对应的数组位置没有值,直接返回null,否则继续判断
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (e = tabAt(tab, (n - 1) & h)) != null) {
          
          
            //如果当前数组位置的元素的hash值和key值均相等,则直接返回
            if ((eh = e.hash) == h) {
          
          
                if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                    return e.val;
            }
            //如果hash值为负数,说明相同hash值的元素组成了红黑树,则直接在红黑数内部查找:TreeBin.find
            else if (eh < 0)
                return (p = e.find(h, key)) != null ? p.val : null;
            //有相同hash值(发生了hash碰撞)的元素组成一个链表,依次在链表中查询目标元素
            while ((e = e.next) != null) {
          
          
                if (e.hash == h &&
                    ((ek = e.key) == key || (ek != null && key.equals(ek))))
                    return e.val;
            }
        }
        return null;
    }
    

    可以看到get操作完全没有加锁,那么多线程操作的时候如何保证正确性呢?通过上面get操作的源码可以看到,每一个key,value会被封装成一个Node,继续看Node的源码.

  2. Node:

    static class Node<K,V> implements Map.Entry<K,V> {
          
          
        final int hash;
        final K key;
        //value为volatile类型的,从而保证了多线程读写的可见性
        volatile V val;
        //发生hash碰撞时,记录下一个元素,类型也是volatile的,从而保证可见性
        volatile Node<K,V> next;
        Node(int hash, K key, V val, Node<K,V> next) {
          
          
            this.hash = hash;
            this.key = key;
            this.val = val;
            this.next = next;
        }
    }
    

    这里ConcurrentHashMap是使用volatile来保证多线程操作的可见性的,从而避免了加锁逻辑。

  3. put:

    public V put(K key, V value) {
          
          
        //具体的实现逻辑在putVal
        return putVal(key, value, false);
    }
    
    /**
      * 将key,value键值对放入到map中
      * @param key 键
      * @param value 值
      * @return 如果先前key的位置有值,则返回老的值,否则返回null
      */
    final V putVal(K key, V value, boolean onlyIfAbsent) {
          
          
        //可以看到ConcurrentHashMap的key和value都不允许为null
        if (key == null || value == null) throw new NullPointerException();
        //将key的hashcode进一步散列,减少hash碰撞
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
          
          
            Node<K,V> f; int n, i, fh;
            //记录元素的Node数组为null时要先进行初始化
            if (tab == null || (n = tab.length) == 0)
                //初始化table,见下文分析
                tab = initTable();
            //如果当前位置为null,可以直接放入元素
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
          
          
                //CAS写入元素,如果成功则返回;CAS失败说明有另外的线程在进行put操作,需要自旋等待
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            //数组在扩容中
            else if ((fh = f.hash) == MOVED)
                //当前线程帮助执行扩容操作,将数组划分执行数据移动
                tab = helpTransfer(tab, f);
            else {
          
          //当前数组位置已经有值了
                V oldVal = null;
                //对当前节点加锁,防止其他线程并发更新
                synchronized (f) {
          
          
                    if (tabAt(tab, i) == f) {
          
          //防止其他线程更改tabb在i位置的值,如果发生更新则继续循环
                        if (fh >= 0) {
          
          //hash值相同的节点为链表
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
          
          
                                K ek;
                                //如果找到key值相同的节点,说明需要更新数据
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
          
          
                                    //保存原来的值
                                    oldVal = e.val;
                                    //putIfAbsent?
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                //更新节点的next节点为新加入的节点
                                if ((e = e.next) == null) {
          
          
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        //如果hash值相同的节点为红黑树,则在红黑树内部执行节点新增或者更新逻辑
                        else if (f instanceof TreeBin) {
          
          
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                                  value)) != null) {
          
          
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                //hash值相同的元素个数>0
                if (binCount != 0) {
          
          
                    //节点超过8个,若<64则扩容链表,否则从链表转化为红黑树,提升查询效率
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        //增加数组元素个数,并判断是否需要扩容,若需要则进行扩容操作
        addCount(1L, binCount);
        return null;
    }
    
    /**
      * 初始化Node数组
      */
    private final Node<K,V>[] initTable() {
          
          
        Node<K,V>[] tab; int sc;
        //数组为空时,持续循环
        while ((tab = table) == null || tab.length == 0) {
          
          
            //sc == -1,说明有多个线程同时在执行初始化操作,此线程竞争失败,让出cpu执行权
            if ((sc = sizeCtl) < 0)
                Thread.yield(); //让出cpu控制权,自旋等待
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
          
          //cas成功,进行初始化,并将sizectl的值设置为-1
                try {
          
          
                    if ((tab = table) == null || tab.length == 0) {
          
          
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = tab = nt;
                        sc = n - (n >>> 2);
                    }
                } finally {
          
          
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }
    
  4. 总结:可以看到ConcurrentHashMap的get操作完全没有加锁,put操作只有在hash碰撞的时候才会在冲突节点上加上Sychronized锁,整体的效率是非常高的。另外,需要注意的是:在执行put操作的时候,会进行扩容操作,而扩容时候比较耗时的,在实际应用过程中,如果需要大量数据的频繁写入,可以在初始化的时候指定一个较大的容量,避免频率扩容带来的开销。

猜你喜欢

转载自blog.csdn.net/a1774381324/article/details/120773878