ConcurrentHashMap并发安全设计思路

一. 前言

以JDK1.8版本的ConcurrentHashMap为例,分析一下针对并发场景是如何保证线程安全的,以及从中能得到哪些并发设计的启发。

二. 核心思想

2.1 设计要解决问题

由于ConcurrentHashMap是JDK中的一个基础容器,因此设计时要保证以下三点:

  • 结构简化。
  • 高性能。
  • 线程安全。

结构简化:是对比1.7版本来说的(后面我们会讲1.7时设计思路),在1.7中使用segment锁来控制并发粒度,这样使得concurrentHashMap的结构变的复杂一层,很多其他的操作都需要兼容这个复杂的结构变动。

高性能:尽可量的减少get时的阻塞,加快put,扩容的效率。

线程安全:保证高并发下get,put,扩容的线程安全。

2.2 设计核心思路

  • 仍然用Node[]来存储ConcurrentHashMap的元素,变成和hashMap一样了。
  • 通过volatile确保获取到的值为最新,减少同步阻塞。
  • 通过减小锁粒度增加并发量,理想情况下线程的put操作都为并行操作。
    • 当table[i]上没有值时,对table[i]做cas操作保证第一次安全。
    • 当table[i]上有值时,不管时链表还是红黑树,都对table[i]加锁,直接锁住头节点,保证了线程安全。

三. 初始化节点时线程安全

3.1 初始化时机

初始化ConcurrentHashMap的时候这个Node[]数组是还未初始化的,会等到第一次put方法调用时才初始化的initTable方法。

final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
            //判断Node数组为空
            if (tab == null || (n = tab.length) == 0)
                //初始化Node数组
                tab = initTable();
          ...
}
复制代码

3.2 初始化时并发安全

此时如果多个线程同时调用initTable初始化Node数组怎么办?

private final Node<K,V>[] initTable() {
  Node<K,V>[] tab; int sc;
  //每次循环都获取最新的Node数组引用
  while ((tab = table) == null || tab.length == 0) {
    //sizeCtl是一个标记位,若为-1也就是小于0,代表有线程在进行初始化工作了
    if ((sc = sizeCtl) < 0)
      //让出CPU时间片
      Thread.yield(); 
    //CAS操作,将本实例的sizeCtl变量设置为-1
    else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
      //如果CAS操作成功了,代表本线程将负责初始化工作
      try {
        //再检查一遍数组是否为空
        if ((tab = table) == null || tab.length == 0) {
          //在初始化Map时,sizeCtl代表数组大小,默认16
          //所以此时n默认为16
          int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
          @SuppressWarnings("unchecked")
          //Node数组
          Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
          //将其赋值给table变量
          table = tab = nt;
          //通过位运算,n减去n二进制右移2位,相当于乘以0.75
          //例如16经过运算为12,与乘0.75一样,只不过位运算更快
          sc = n - (n >>> 2);
        }
      } finally {
        //将计算后的sc(12)直接赋值给sizeCtl,表示达到12长度就扩容
        //由于这里只会有一个线程在执行,直接赋值即可,没有线程安全问题
        //只需要保证可见性
        sizeCtl = sc;
      }
      break;
    }
  }
  return tab;
}
复制代码
  • 上面方法当一个线程通过CAS获取到锁资源后,回立即更改sizeCtl = -1,其他线程循环判断时发现sizeCtl < 0就进行yield操作释放cpu资源,这样就降低了锁循环导致的cpu升高。
  • 但通过yield方法并不能杜绝cpu问题,因为释放后线程还是要重新竞争,有可能一直竞争到cpu还是会高。
  • table变量和sizeCtl都用volatile来保证可见性;
  • CAS操作保证了设置sizeCtl标记位的原子性,保证了只有一个线程能设置成功

四. TreeNode变成TreeBin

在1.8的hashMap中,红黑树是由TreeNode节点之间关系组成的,而在concurrentHashMap用一个treeBin对象来包裹了一颗树。treeBin里面保留的树的结构。

为什么要这么设计呢?

因为线程安全concurrentHashMap在链表是锁住头节点,但在红黑树里面根节点是可能发生变化的,因此不能锁住根节点,将整个树封装起来加锁更好实现。

五. PUT结点的线程安全

put结点是只要安全的锁住头结点,下面的操作则和hashMap区别不大,我们直接看代码

final V putVal(K key, V value, boolean onlyIfAbsent) {
  if (key == null || value == null) throw new NullPointerException();
  //对key的hashCode进行散列
  int hash = spread(key.hashCode());
  int binCount = 0;
  //一个无限循环,直到put操作完成后退出循环
  for (Node<K,V>[] tab = table;;) {
    Node<K,V> f; int n, i, fh;
    //当Node数组为空时进行初始化
    if (tab == null || (n = tab.length) == 0)
      tab = initTable();
    //Unsafe类volatile的方式取出hashCode散列后通过与运算得出的Node数组下标值对应的Node对象
    //此时的Node对象若为空,则代表还未有线程对此Node进行插入操作
    else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
      //直接CAS方式插入数据
      if (casTabAt(tab, i, null,
                   new Node<K,V>(hash, key, value, null)))
        //插入成功,退出循环
        break;                   // no lock when adding to empty bin
    }
    //查看是否在扩容,先不看,扩容再介绍
    else if ((fh = f.hash) == MOVED)
      //帮助扩容
      tab = helpTransfer(tab, f);
    else {
      V oldVal = null;
      //对Node对象进行加锁
      synchronized (f) {
        //二次确认此Node对象还是原来的那一个
        if (tabAt(tab, i) == f) {
          if (fh >= 0) {
            binCount = 1;
            //无限循环,直到完成put
            for (Node<K,V> e = f;; ++binCount) {
              K ek;
              //和HashMap一样,先比较hash,再比较equals
              if (e.hash == hash &&
                  ((ek = e.key) == key ||
                   (ek != null && key.equals(ek)))) {
                oldVal = e.val;
                if (!onlyIfAbsent)
                  e.val = value;
                break;
              }
              Node<K,V> pred = e;
              if ((e = e.next) == null) {
                //和链表头Node节点不冲突,就将其初始化为新Node作为上一个Node节点的next
                //形成链表结构
                pred.next = new Node<K,V>(hash, key,
                                          value, null);
                break;
              }
            }
          }
}
复制代码

核心是tabAt(tab, i)方法,其使用Unsafe类volatile的操作volatile式地查看值,保证每次获取到的值都是最新的。

static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
  return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}
复制代码

注意:虽然上面的table变量加了volatile,但也只能保证其引用的可见性,并不能确保其数组中的对象是否是最新的,所以需要Unsafe类volatile式地拿到最新的Node。

六. 扩容线程安全

6.1 扩容时机

由于其减小了锁的粒度,若Hash完美不冲突的情况下,可同时支持n个线程同时put操作,n为Node数组大小,在默认大小16下,可以支持最大同时16个线程无竞争同时操作且线程安全。当hash冲突严重时,Node链表越来越长,将导致严重的锁竞争,此时会进行扩容。

在put时根据hash找到Node[]数组中的一个位置,如果这个位置有节点值并且有线程正在处理busy = true,则从新进行hash计算,试图找到最新位置,如果最新位置还是被锁定,说明Node[]离散性不够(冲突严重),需要进行扩容。

扩容限制:不会无限制的扩容下去,如果在扩容时发现原数组被其他线程更改,则不会扩容。

6.2 扩容方式

  • 每个Node节点支持仅支持一个线程进行扩容转移,多个Node节点可支持多线程,具体哪个线程控制哪个节点随机决定,控制多少由步长决定。

  • 当发生扩容时,正在转移的Node被设置成fwd,如果此时有线程想要put到这个位置,不能直接put进来(直接put就不安全了,但可以PUT到其他没有扩容到的节点中 )。

  • 没能成功put的线程也不会闲着等待,而是帮助扩容线程完成转移(如果一个线程完成了负责转移的节点也会去看是否需要帮忙),完成扩容后重新计算index再put。如果线程发现所有的Node节点都有线程负责转移,那么就将finish = true,也就是不需要帮助。

  • 在扩容过程中同时支持get查数据,若有线程put数据,还会帮助一起扩容,这种无阻塞算法,将并行最大化的设计。

6.3 扩容线程独立作用域

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
  int n = tab.length, stride;
  //根据机器CPU核心数来计算,一条线程负责Node数组中多长的迁移量
  if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
    //本线程分到的迁移量
    //假设为16(默认也为16)
    stride = MIN_TRANSFER_STRIDE; // subdivide range
  //nextTab若为空代表线程是第一个进行迁移的
  //初始化迁移后的新Node数组
  if (nextTab == null) {            // initiating
    try {
      @SuppressWarnings("unchecked")
      //这里n为旧数组长度,左移一位相当于乘以2
      //例如原数组长度16,新数组长度则为32
      Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
      nextTab = nt;
    } catch (Throwable ex) {      // try to cope with OOME
      sizeCtl = Integer.MAX_VALUE;
      return;
    }
    //设置nextTable变量为新数组
    nextTable = nextTab;
    //假设为16
    transferIndex = n;
  }
  //假设为32
  int nextn = nextTab.length;
  //标示Node对象,此对象的hash变量为-1
  //在get或者put时若遇到此Node,则可以知道当前Node正在迁移
  //传入nextTab对象
  ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
  boolean advance = true;
  boolean finishing = false; // to ensure sweep before committing nextTab
  for (int i = 0, bound = 0;;) {
    Node<K,V> f; int fh;
    while (advance) {
      int nextIndex, nextBound;
      //i为当前正在处理的Node数组下标,每次处理一个Node节点就会自减1
      if (--i >= bound || finishing)
        advance = false;
      //假设nextIndex=16
      else if ((nextIndex = transferIndex) <= 0) {
        i = -1;
        advance = false;
      }
      //由以上假设,nextBound就为0
      //且将nextIndex设置为0
      else if (U.compareAndSwapInt
               (this, TRANSFERINDEX, nextIndex,
                nextBound = (nextIndex > stride ?
                             nextIndex - stride : 0))) {
        //bound=0
        bound = nextBound;
        //i=16-1=15
        i = nextIndex - 1;
        advance = false;
      }
    }
    if (i < 0 || i >= n || i + n >= nextn) {
      int sc;
      if (finishing) {
        nextTable = null;
        table = nextTab;
        sizeCtl = (n << 1) - (n >>> 1);
        return;
      }
      if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
        if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
          return;
        finishing = advance = true;
        i = n; // recheck before commit
      }
    }
    //此时i=15,取出Node数组下标为15的那个Node,若为空则不需要迁移
    //直接设置占位标示,代表此Node已处理完成
    else if ((f = tabAt(tab, i)) == null)
      advance = casTabAt(tab, i, null, fwd);
    //检测此Node的hash是否为MOVED,MOVED是一个常量-1,也就是上面说的占位Node的hash
    //如果是占位Node,证明此节点已经处理过了,跳过i=15的处理,继续循环
    else if ((fh = f.hash) == MOVED)
      advance = true; // already processed
    else {
      //锁住这个Node
      synchronized (f) {
        //确认Node是原先的Node
        if (tabAt(tab, i) == f) {
          //ln为lowNode,低位Node,hn为highNode,高位Node
          //这两个概念下面以图来说明
          Node<K,V> ln, hn;
          if (fh >= 0) {
            //此时fh与原来Node数组长度进行与运算
            //如果高X位为0,此时runBit=0
            //如果高X位为1,此时runBit=1
            int runBit = fh & n;
            Node<K,V> lastRun = f;
            for (Node<K,V> p = f.next; p != null; p = p.next) {
              //这里的Node,都是同一Node链表中的Node对象
              int b = p.hash & n;
              if (b != runBit) {
                runBit = b;
                lastRun = p;
              }
            }
            //正如上面所说,runBit=0,表示此Node为低位Node
            if (runBit == 0) {
              ln = lastRun;
              hn = null;
            }
            else {
              //Node为高位Node
              hn = lastRun;
              ln = null;
            }
            for (Node<K,V> p = f; p != lastRun; p = p.next) {
              int ph = p.hash; K pk = p.key; V pv = p.val;
              //若hash和n与运算为0,证明为低位Node,原理同上
              if ((ph & n) == 0)
                ln = new Node<K,V>(ph, pk, pv, ln);
              //这里将高位Node与地位Node都各自组成了两个链表
              else
                hn = new Node<K,V>(ph, pk, pv, hn);
            }
            //将低位Node设置到新Node数组中,下标为原来的位置
            setTabAt(nextTab, i, ln);
            //将高位Node设置到新Node数组中,下标为原来的位置加上原Node数组长度
            setTabAt(nextTab, i + n, hn);
            //将此Node设置为占位Node,代表处理完成
            setTabAt(tab, i, fwd);
            //继续循环
            advance = true;
          }
          ....
        }
      }
    }
  }
}
复制代码

其本质是分离出每个线程对Node的作用域是独立的,防止一个Node被多个线程并发处理。

采用的方式就是对transIndex进行CAS,根据每个线程对transIndex的值计算出bound,nextIndex,nextBound等等。

image.png

6.4 高低链表设计

从上面代码可以看到,这迁移时要分一个ln(低位Node)、hn(高位Node)。为什么要这么设计呢?

我们知道,在put值的时候,首先会计算hash值,再散列到指定的Node数组下标中:

//根据key的hashCode再散列
int hash = spread(key.hashCode());
//使用(n - 1) & hash 运算,定位Node数组中下标值,n为Node数组的长度,假设为16
(f = tabAt(tab, i = (n - 1) & hash);
复制代码

举例看下扩容规律:

假设有一个key进来,它的散列之后的hash=9,那么它的下标值是多少呢?

  • (16 - 1)和 9 进行与运算 -> 0000 1111 和 0000 1001 结果还是 0000 1001 = 9

    假设Node数组需要扩容到32,那么下标值会是多少呢?

  • (32 - 1)和 9 进行与运算 -> 0001 1111 和 0000 1001 结果还是9

再假设一个key进来,散列之后的hash换成20,会怎样呢?

  • (16 - 1)和 20 进行与运算 -> 0000 1111 和 0001 0100 结果是 0000 0100 = 4
  • (32 - 1)和 20 进行与运算 -> 0001 1111 和 0001 0100 结果是 0001 0100 = 20

如果hash在高X位为1,(X为数组长度的二进制-1的最高位),则扩容时是需要变换在Node数组中的索引值的,不然就hash不到,丢失数据,所以这里在迁移的时候将高X位为1的Node分类为hn,将高X位为0的Node分类为ln。

for (Node<K,V> p = f; p != lastRun; p = p.next) {
  int ph = p.hash; 
  K pk = p.key; 
  V pv = p.val;
  if ((ph & n) == 0)
    ln = new Node<K,V>(ph, pk, pv, ln);
  else
    hn = new Node<K,V>(ph, pk, pv, hn);
}
复制代码

这个操作将高低位组成了两条链表结构,由下图所示:

image.png 然后将其CAS操作放入新的Node数组中:

setTabAt(nextTab, i, ln);
setTabAt(nextTab, i + n, hn);
复制代码

其中,低位链表放入原下标处,而高位链表则需要加上原Node数组长度,这样就可以保证高位Node在迁移到新Node数组中依然可以使用hash算法散列到对应下标的数组中去了。

最后将原Node数组中对应下标Node对象设置为fwd标记Node,表示该节点迁移完成,到这里,一个节点的迁移就完成了,将进行下一个节点的迁移。

6.5 扩容时的get操作

假设Node下标为16的Node节点正在迁移,突然有一个线程进来调用get方法,正好key又散列到下标为16的节点,此时怎么办?

public V get(Object key) {
  Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
  int h = spread(key.hashCode());
  if ((tab = table) != null && (n = tab.length) > 0 &&
      (e = tabAt(tab, (n - 1) & h)) != null) {
    if ((eh = e.hash) == h) {
      if ((ek = e.key) == key || (ek != null && key.equals(ek)))
        return e.val;
    }
    //假如Node节点的hash值小于0
    //则有可能是fwd节点
    else if (eh < 0)
      //调用节点对象的find方法查找值
      return (p = e.find(h, key)) != null ? p.val : null;
    while ((e = e.next) != null) {
      if (e.hash == h &&
          ((ek = e.key) == key || (ek != null && key.equals(ek))))
        return e.val;
    }
  }
  return null;
}
复制代码

判断Node中的hash是否小于0,是否还记得我们的占位Node,其hash为MOVED,为常量值-1,所以此时判断线程正在迁移这个节点。我们看下find方法:

//内部类 ForwardingNode中
Node<K,V> find(int h, Object k) {
  // loop to avoid arbitrarily deep recursion on forwarding nodes
  // 这里的查找,是去新Node数组中查找的
  // 下面的查找过程与HashMap查找无异,不多赘述
  outer: for (Node<K,V>[] tab = nextTable;;) {
    Node<K,V> e; int n;
    if (k == null || tab == null || (n = tab.length) == 0 ||
        (e = tabAt(tab, (n - 1) & h)) == null)
      return null;
    for (;;) {
      int eh; K ek;
      if ((eh = e.hash) == h &&
          ((ek = e.key) == k || (ek != null && k.equals(ek))))
        return e;
      if (eh < 0) {
        if (e instanceof ForwardingNode) {
          tab = ((ForwardingNode<K,V>)e).nextTable;
          continue outer;
        }
        else
          return e.find(h, k);
      }
      if ((e = e.next) == null)
        return null;
    }
  }
}
复制代码

get方法不会修改数据,因此在扩容迁移时应该支持不阻塞的get操作,其实现方式就是占位Node需要保存新Node数组的引用。

6.6 多线程协助扩容

6.6.1 协助扩容时机

  • 在put值时,发现Node为占位Node(fwd)时,会协助扩容。
  • 在新增节点后,检测到链表长度大于8时,且数组长度小于64,会主动扩容。
  • 在每次新增节点之后,都会调用addCount方法,检测容器元素是否达到阈值。

6.6.2 协助扩容方式

在put操作时,假设正在迁移,正好有一个线程进来,想要put值到迁移的Node上,怎么办?

final V putVal(K key, V value, boolean onlyIfAbsent) {
  if (key == null || value == null) throw new NullPointerException();
  int hash = spread(key.hashCode());
  int binCount = 0;
  for (Node<K,V>[] tab = table;;) {
    Node<K,V> f; int n, i, fh;
    if (tab == null || (n = tab.length) == 0)
      tab = initTable();
    else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
      if (casTabAt(tab, i, null,
                   new Node<K,V>(hash, key, value, null)))
        break;                   // no lock when adding to empty bin
    }
    //若此时发现了占位Node,证明此时HashMap正在迁移
    else if ((fh = f.hash) == MOVED)
      //进行协助迁移
      tab = helpTransfer(tab, f);
     ...
}
复制代码
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
  Node<K,V>[] nextTab; int sc;
  if (tab != null && (f instanceof ForwardingNode) &&
      (nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
    int rs = resizeStamp(tab.length);
    while (nextTab == nextTable && table == tab &&
           (sc = sizeCtl) < 0) {
      if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
          sc == rs + MAX_RESIZERS || transferIndex <= 0)
        break;
      //sizeCtl加一,标示多一个线程进来协助扩容
      if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
        //扩容
        transfer(tab, nextTab);
        break;
      }
    }
    return nextTab;
  }
  return table;
}

复制代码

此时sizeCtl变量用来标示HashMap正在扩容,当其准备扩容时,会将sizeCtl设置为一个负数,(例如数组长度为16时)其二进制表示为:

1000 0000 0001 1011 0000 0000 0000 0010
复制代码

无符号位为1,表示负数。其中高16位代表数组长度的一个位算法标识,低16位表示有几个线程正在做迁移,刚开始为2,接下来自增1,线程迁移完会进行减1操作,也就是如果低十六位为2,代表有一个线程正在迁移,如果为3,代表2个线程正在迁移以此类推。

只要数组长度足够长,就可以同时容纳足够多的线程来一起扩容,最大化并行任务,提高性能。

七. 统计容器大小的线程安全

上文中提到一个关键值,容器大小,直接控制hash和扩容等一系列操作,每次添加节点时都会addCount,怎么保证一个这个大小的多线程安全呢?

7.1 计数桶

image.png 在设计中,使用了分而治之的思想,将每一个计数都分散到各个countCell对象里面(下面称之为桶),使竞争最小化,又使用了CAS操作,就算有竞争,也可以对失败了的线程进行其他的处理。

/计数,并检查长度是否达到阈值
private final void addCount(long x, int check) {
  //计数桶
  CounterCell[] as; long b, s;
  //如果counterCells不为null,则代表已经初始化了,直接进入if语句块
  //若竞争不严重,counterCells有可能还未初始化,为null,先尝试CAS操作递增baseCount值
  if ((as = counterCells) != null ||
      !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
    //进入此语句块有两种可能
    //1.counterCells被初始化完成了,不为null
    //2.CAS操作递增baseCount值失败了,说明有竞争
    CounterCell a; long v; int m;
    //标志是否存在竞争
    boolean uncontended = true;
    //1.先判断计数桶是否还没初始化,则as=null,进入语句块
    //2.判断计数桶长度是否为空或,若是进入语句块
    //3.这里做了一个线程变量随机数,与上桶大小-1,若桶的这个位置为空,进入语句块
    //4.到这里说明桶已经初始化了,且随机的这个位置不为空,尝试CAS操作使桶加1,失败进入语句块
    if (as == null || (m = as.length - 1) < 0 ||
        (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
        !(uncontended =
          U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
      fullAddCount(x, uncontended);
      return;
    }
    if (check <= 1)
      return;
    //统计容器大小
    s = sumCount();
  }
  ...
}
复制代码

7.2 计数桶优化

计数桶的优化,当竞争比较少时,计数桶的意义不大。因此实际使用了两种思路:

  • CAS方式直接递增:在线程竞争不大的时候,直接使用CAS操作递增baseCount值即可,这里说的竞争不大指的是CAS操作不会失败的情况
  • 分而治之桶计数:若出现了CAS操作失败的情况,则证明此时有线程竞争了,计数方式从CAS方式转变为分而治之的桶计数方式
private final void fullAddCount(long x, boolean wasUncontended) {
        int h;
        if ((h = ThreadLocalRandom.getProbe()) == 0) {
            ThreadLocalRandom.localInit();      // force initialization
            h = ThreadLocalRandom.getProbe();
            wasUncontended = true;
        }
        boolean collide = false;                // True if last slot nonempty
        for (;;) {
            CounterCell[] as; CounterCell a; int n; long v;
            ...
            //如果计数桶!=null,证明已经初始化,此时不走此语句块
            if ((as = counterCells) != null && (n = as.length) > 0) {
              ...
            }
            //进入此语句块进行计数桶的初始化
            //CAS设置cellsBusy=1,表示现在计数桶Busy中...
            else if (cellsBusy == 0 && counterCells == as &&
                     U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
                //若有线程同时初始化计数桶,由于CAS操作只有一个线程进入这里
                boolean init = false;
                try {                           // Initialize table
                    //再次确认计数桶为空
                    if (counterCells == as) {
                        //初始化一个长度为2的计数桶
                        CounterCell[] rs = new CounterCell[2];
                        //h为一个随机数,与上1则代表结果为0、1中随机的一个
                        //也就是在0、1下标中随便选一个计数桶,x=1,放入1的值代表增加1个容量
                        rs[h & 1] = new CounterCell(x);
                        //将初始化好的计数桶赋值给ConcurrentHashMap
                        counterCells = rs;
                        init = true;
                    }
                } finally {
                    //最后将busy标识设置为0,表示不busy了
                    cellsBusy = 0;
                }
                if (init)
                    break;
            }
            //若有线程同时来初始化计数桶,则没有抢到busy资格的线程就先来CAS递增baseCount
            else if (U.compareAndSwapLong(this, BASECOUNT, v = baseCount, v + x))
                break;                          // Fall back on using base
        }
    }
复制代码

7.3 计数桶扩容

上面的分析中我们知道,计数桶初始化之后长度为2,在竞争大的时候肯定是不够用的,所以一定有计数桶的扩容操作。

7.3.1 计数桶扩容时机

在CAS操作递增计数桶失败了3次之后,会进行扩容计数桶操作,注意此时同时进行了两次随机定位计数桶来进行CAS递增的,所以此时可以保证大概率是因为计数桶不够用了,才会进行计数桶扩容

7.3.2 扩容操作

计数桶长度增加到两倍长度,数据直接遍历迁移过来,由于计数桶不像HashMap数据结构那么复杂,有hash算法的影响,加上计数桶只是存放一个long类型的计数值而已,所以直接赋值引用即可。

7.3.3 设计启发

  • 利用CAS感知是否存在线程竞争,若竞争不大直接CAS递增值即可,性能与直接加差别不大。
  • 若存在线程竞争,采用分治思想分散线程,减少冲突,“负载均衡"一样的将线程计数请求接近均匀的落在各个桶中。

八. JDK1.7版本设计思路

因为主流的版本都是1.8以上,因此1.7的设计显得有些落后了,不过依然有很多值得借鉴的地方,这里我简单过一下。

8.1 改造hashMap成为线程安全的思路

  • 第一种:借鉴hashTable

为put方法用synchronized上对象锁,保证安全,缺点是粒度粗,并发性能差。

  • 第二种:分段锁

针对第一种粒度粗的问题,解决方案就是降级,将原本的HashMap=>Entry[]变成ConcurrentHashMap => Segment[] => Entry[],中间多了一个segment类型,对segment进行加锁,这样粒度变小了一些。

第一种性能缺陷太明显,1.7采用了第二种方案。

8.2 如何分段

根据三个重要参数推导分段规则:

  • 第一个参数代表entry的总个数
  • 第二个参数是负载因子
  • 第三个参数是segment的总个数

那么一个segment里有几个entry呢,这个关系不是固定的,通过entry总数/ seg总数向上取整

比如CEIL(17 /16) = 2

另外沿用hashMap的标准,每一个entry数组的长度必须是2的幂,因此如果上面算的不是2的幂次,需要转化成2的幂次

比如CEIL(33 /16) = 3, toSize(3) = 4。也就是说一个segment下有4个entry

8.3 put时线程安全

先找到segment,再找到下面的entry。

找segment的index时用hashCode & (segments.length - 1);

插入segment时使用unsafe保证线程安全,内部机制是自旋锁 + cas

找entry的index时用hashCode & (entrys.length - 1);

插入entry时使用tryLock和lock保证线程安全

实现时的几个很绕的细节:

  1. 使用while + tryLock自旋非阻塞,非阻塞期间创建节点

  2. 设置retries重试次数,超过时lock阻塞,避免CPU消耗

  3. 偶数次重试时判断头节点是否被别的线程更新,如果更新需要从新的头节点重新获取,重复123。

注意:put插入时还是头插法

8.4 如何扩容

不破坏HashMap的思想,扩容还是在entry中做,并且采用局部扩容,也就是一个segmeng内的entry进行扩容。

segment长度初始化后就不变了。

细节:transfor方法为什么要进行两次循环?像hashMap一样一次链表循环不就可以了?

这里是一个小优化,第一次循环的目的是链表从后往前寻找rehash后index相同的连续节点,这样连续的节点可以直接一次断链就放到新的位置上,提升性能。(类似蜘蛛纸牌)

猜你喜欢

转载自juejin.im/post/7042866255946055687