Java 集合基础知识 List/Set/Map

一、List Set 区别

  • List 有序,可重复;
  • Set 无序,不重复;

二、List Set 实现类间区别及原理

  • Arraylist 底层实现使用Object[],数组查询效率高

    扩容机制

       1.6采用(capacity * 3)/ 2 + 1,默认容量为10
       1.7采用(capacity >> 2 + capacity)实现,位移动效率高于数学运算,右移一位等于乘以2倍
    读取速度快,写入会 涉及到扩容,所以相对较慢
  • LinkedList底层采用双向链表,只记录 first 和 last(LinkedList.Node);
    • Node记录 E item; Node<E> next; Node<E> prev;
    • 写入速度快,但是读取速度相对较慢
  • HashSet 无序,不重复。
    • 去重原理:所有值保存至HashMap的key中,利用HashMap的键不重复原理达到去重效果;
    • ArrayList去重可采用:new ArrayList(new HastSet(list));
  • TreeSet 有序,不重复。
    • 底层采用TreeMap;

三、Map 实现原理及实现类对比

  1. HashMap 线程不安全

    1) 内部保存以数组 HashMap.Entry<K, V>[] 形式

 1 static class Entry<K, V> implements Map.entry<K, V> {
 2     final K key;
 3     V value;
 4     Entry<K, V> next;
 5     int hash;
 6 
 7     Entry(int h, K k, V v, Entry<K, V> n) {
 8         value = v;
 9         next = n;
10         key = k;
11         hash = h;
12     }
13 }

    2) 线程不安全原因:

      a 在数据操作方法上未采用synchronized同步标识,当多线程发生hash碰撞时,针对hash相等的key只会有一个能成功;

      b 如果上面情况涉及到resize扩容情况,每个线程内都会对内部数组进行重新创建,但只有一个会成功;

    3) 扩容(默认大小为16,2的四次方):

      capacity = (capacity * 2 * loadFactor)

      loadFactor:系数因子,默认为0.75,时间与空间的权衡结果

  2. Hashtable 内部原理及使用几乎等于HashMap,不同的是 所有操作数据方法都进行了 synchronized 修饰,即同步处理,线程安全,但这导致单线程访问情况下效率要低于HashMap;

    JDK4将Hashtable实现了Map接口,在JDK5中创建了替代类:ConcurrentHashMap(同步的HashMap)

    HashMap想要同步可以采用 java.util.Collections.synchronizeMap(hashMap)(jdk2出现);

    同理 Collections.synchronizeCollection(Collection<T> c)

      Collections.synchronizeList(List<T> list)

      Collections.synchronizeSet(Set<T> s)

      Collections.synchronizeSortedMap(SortedMap<K, V> m)

      Collections.synchronizeSortedSet(SortedSet<T> s)

待学习:

  JDK8中的优化点

猜你喜欢

转载自www.cnblogs.com/bearhoney/p/10499927.html