越努力越幸运！

hashmap

HashMap：它根据键的hashCode值存储数据，大多数情况下可以直接定位到它的值，因而具有很快的访问速度，但遍历顺序却是不确定的。 HashMap最多只允许一条记录的键为null，允许多条记录的值为null。HashMap非线程安全，即任一时刻可以有多个线程同时写HashMap，可能会导致数据的不一致。如果需要满足线程安全，可以用 Collections的synchronizedMap方法使HashMap具有线程安全的能力，或者使用ConcurrentHashMap。

hashmap的常见面试题

1.面试官：HashMap的底层实现（如何解决hash冲突，负载因子）

答：

初始容量是16，负载因子是0.75 超过16*0.75后就会扩容，变为32，重新hash

JDK1.8之前

JDK1.8 之前 HashMap 由 数组+链表 组成的（“链表散列” 即数组和链表的结合体），数组是 HashMap 的主体，链表则是主要为了解决哈希冲突而存在的（HashMap 采用 “拉链法也就是链地址法” 解决冲突），如果定位到的数组位置不含链表（当前 entry 的 next 指向 null ）,那么对于查找，添加等操作很快，仅需一次寻址即可；如果定位到的数组包含链表，对于添加操作，其时间复杂度依然为 O(1)，因为最新的 Entry 会插入链表头部，急需要简单改变引用链即可，而对于查找操作来讲，此时就需要遍历链表，然后通过 key 对象的 equals 方法逐一比对查找.

所谓 “拉链法” 就是将链表和数组相结合。也就是说创建一个链表数组，数组中每一格就是一个链表。若遇到哈希冲突，则将冲突的值加到链表中即可。

JDK1.8之后

相比于之前的版本， JDK1.8之后在解决哈希冲突时有了较大的变化，当链表长度大于阈值（默认为8）时，将链表转化为红黑树，以减少搜索时间。

· HashMap有一个叫做Entry的内部类，它用来存储key-value对。
· 上面的Entry对象是存储在一个叫做table的Entry数组中。
· table的索引在逻辑上叫做“桶”(bucket)，它存储了链表的第一个元素。
· key的hashcode()方法用来找到Entry对象所在的桶。
· 如果两个key有相同的hash值，他们会被放在table数组的同一个桶里面。
· key的equals()方法用来确保key的唯一性。
· value对象的equals()和hashcode()方法根本一点用也没有。

简单地说，HashMap 在底层将 key-value 当成一个整体进行处理，这个整体就是一个 Entry 对象。HashMap 底层采用一个 Entry[] 数组来保存所有的 key-value 对，当需要存储一个 Entry 对象时，会根据hash算法来决定其在数组中的存储位置，在根据equals方法决定其在该数组位置上的链表中的存储位置；当需要取出一个Entry时，也会根据hash算法找到其在数组中的存储位置，再根据equals方法从该位置上的链表中取出该Entry。

2.面试官：hashmap1.8为什么要采用红黑树而不是B树或者B+树呢？

红黑树多用在内部排序，即全放在内存中的，STL的map和set的内部实现就是红黑树。

B+树多用于外存上时，B+也被成为一个磁盘友好的数据结构。

3.面试官：为什么hashmap1.8不是一开始就用红黑树，而是要超过8以后才是使用红黑树呢？

答：因为红黑树的平均查找长度是log（n），长度为8的时候，平均查找长度为3。。如果继续使用链表，平均查找长度为8/2=4。这才有转换为树的必要。。链表长度如果是6以内，6/2=3，速度也很快的。转化为树还有生成树的时间，并不明智。

长度为8，链表转树，长度为6，树转链表。。中间有个差值，还可以防止链表和树频繁转换。假设8以上转为树，8以下转为链表，那么一个hashmap如果不停的插入删除，链表长度在8左右徘徊，就会不停的树转链表，链表转树，效率很

4.面试官：hashmap的get操作

答：

当你传递一个key从hashmap总获取value的时候：

对key进行null检查。如果key是null，table[0]这个位置的元素将被返回。

key的hashcode()方法被调用，然后计算hash值。

indexFor(hash,table.length)用来计算要获取的Entry对象在table数组中的精确的位置，使用刚才计算的hash值。

在获取了table数组的索引之后，会迭代链表，调用equals()方法检查key的相等性，如果equals()方法返回true，get方法返回Entry对象的value，否则，返回null。

5.面试官：hashmap的put操作

首先对key做null检查。如果key是null，会被存储到table[0]，因为null的hash值总是0。

key的hashcode()方法会被调用，然后计算hash值。hash值用来找到存储Entry对象的数组的索引。有时候hash函数可能写的很不好，所以JDK的设计者添加了另一个叫做hash()的方法，它接收刚才计算的hash值作为参数。

indexFor(hash,table.length)用来计算在table数组中存储Entry对象的精确的索引。

在我们的例子中已经看到，如果两个key有相同的hash值(也叫冲突)，他们会以链表的形式来存储。所以，这里我们就迭代链表。

· 如果在刚才计算出来的索引位置没有元素，直接把Entry对象放在那个索引上。

· 如果索引上有元素，然后会进行迭代，一直到Entry->next是null。当前的Entry对象变成链表的下一个节点。

· 如果我们再次放入同样的key会怎样呢？逻辑上，它应该替换老的value。事实上，它确实是这么做的。在迭代的过程中，会调用equals()方法来检查key的相等性(key.equals(k))，如果这个方法返回true，它就会用当前Entry的value来替换之前的value。

答：

①.判断键值对数组table[i]是否为空或为null，否则执行resize()进行扩容；

②.根据键值key计算hash值得到插入的数组索引i，如果table[i]==null，直接新建节点添加，转向⑥，如果table[i]不为空，转向③；

③.判断table[i]的首个元素是否和key一样，如果相同直接覆盖value，否则转向④，这里的相同指的是hashCode以及equals；

④.判断table[i] 是否为treeNode，即table[i] 是否是红黑树，如果是红黑树，则直接在树中插入键值对，否则转向⑤；

⑤.遍历table[i]，判断链表长度是否大于8，大于8的话把链表转换为红黑树，在红黑树中执行插入操作，否则进行链表的插入操作；遍历过程中若发现key已经存在直接覆盖value即可；

⑥.插入成功后，判断实际存在的键值对数量size是否超多了最大容量threshold，如果超过，进行扩容。

6.面试官：平时在使用HashMap时一般使用什么类型的元素作为Key？

面试者通常会回答，使用String或者Integer这样的类。这个时候可以继续追问为什么使用String、Integer呢？这些类有什么特点？如果面试者有很好的思考，可以回答出这些类是Immutable的，并且这些类已经很规范的覆写了hashCode()以及equals()方法。作为不可变类天生是线程安全的，而且可以很好的优化比如可以缓存hash值，避免重复计算等等，那么基本上这道题算是过关了。

7.面试官：如果让你实现一个自定义的class作为HashMap的key该如何实现？

参考

8.面试官：hashcode equal

https://blog.csdn.net/haobaworenle/article/details/53819838

9.面试官：HashMap是线程安全的吗？如果多个线程操作同一个HashMap对象会产生哪些非正常现象？

不是 https://www.cnblogs.com/andy-zhou/p/5402984.html

10.面试官：HashMap中bucket的大小为什么是2的幂？

为了能让 HashMap 存取高效，尽量较少碰撞，也就是要尽量把数据分配均匀，每个链表/红黑树长度大致相同。这个实现就是把数据存到哪个链表/红黑树中的算法。

“取余(%)操作中如果除数是2的幂次则等价于与其除数减一的与(&)操作（也就是说 hash%length==hash&(length-1)的前提是 length 是2的 n 次方；）。” 并且 采用二进制位操作 &，相对于%能够提高运算效率。

11.面试官：为什么HashMap中负载因子子是0.75？

Node[] table的初始化长度length(默认值是16)，Load factor为负载因子(默认值是0.75)，threshold是HashMap所能容纳的最大数据量的Node(键值对)个数。threshold = length * Load factor。也就是说，在数组定义好长度之后，负载因子越大，所能容纳的键值对个数越多。

结合负载因子的定义公式可知，threshold就是在此Load factor和length(数组长度)对应下允许的最大元素数目，超过这个数目就重新resize(扩容)，扩容后的HashMap容量是之前容量的两倍。默认的负载因子0.75是对空间和时间效率的一个平衡选择，建议大家不要修改，除非在时间和空间比较特殊的情况下，如果内存空间很多而又对时间效率要求很高，可以降低负载因子Load factor的值；相反，如果内存空间紧张而对时间效率要求不高，可以增加负载因子loadFactor的值，这个值可以大于1。

12.面试官：HashMap 和 Hashtable 的区别

答：

线程是否安全： HashMap 是非线程安全的，HashTable 是线程安全的；HashTable 内部的方法基本都经过 synchronized 修饰。（如果你要保证线程安全的话就使用 ConcurrentHashMap 吧！）；

效率： 因为线程安全的问题，HashMap 要比 HashTable 效率高一点。另外，HashTable 基本被淘汰，不要在代码中使用它；

对Null key 和Null value的支持： HashMap 中，null 可以作为键，这样的键只有一个，可以有一个或多个键所对应的值为 null。。但是在 HashTable 中 put 进的键值只要有一个 null，直接抛出 NullPointerException。

初始容量大小和每次扩充容量大小的不同： ①创建时如果不指定容量初始值，Hashtable 默认的初始大小为11，之后每次扩充，容量变为原来的2n+1。HashMap 默认的初始化大小为16。之后每次扩充，容量变为原来的2倍。②创建时如果给定了容量初始值，那么 Hashtable 会直接使用你给定的大小，而 HashMap 会将其扩充为2的幂次方大小。也就是说 HashMap 总是使用2的幂作为哈希表的大小。

底层数据结构： JDK1.8 以后的 HashMap 在解决哈希冲突时有了较大的变化，当链表长度大于阈值（默认为8）时，将链表转化为红黑树，以减少搜索时间。Hashtable 没有这样的机制。

java集合（5）—hashmap

越努力越幸运！

hashmap

hashmap的常见面试题

1.面试官：HashMap的底层实现（如何解决hash冲突，负载因子）

JDK1.8之前

JDK1.8之后

2.面试官：hashmap1.8为什么要采用红黑树而不是B树或者B+树呢？

3.面试官：为什么hashmap1.8不是一开始就用红黑树，而是要超过8以后才是使用红黑树呢？

4.面试官：hashmap的get操作

5.面试官：hashmap的put操作

6.面试官：平时在使用HashMap时一般使用什么类型的元素作为Key？

7.面试官：如果让你实现一个自定义的class作为HashMap的key该如何实现？

参考

8.面试官：hashcode equal

9.面试官：HashMap是线程安全的吗？如果多个线程操作同一个HashMap对象会产生哪些非正常现象？

10.面试官：HashMap中bucket的大小为什么是2的幂？

11.面试官：为什么HashMap中负载因子子是0.75？

12.面试官：HashMap 和 Hashtable 的区别

猜你喜欢

java集合（5）—hashmap

越努力越幸运！

hashmap

hashmap的常见面试题

1.面试官：HashMap的底层实现（如何解决hash冲突 ，负载因子）

JDK1.8之前

JDK1.8之后

2.面试官：hashmap1.8为什么要采用红黑树而不是B树或者B+树呢？

3.面试官：为什么hashmap1.8不是一开始就用红黑树，而是要超过8以后才是使用红黑树呢？

4.面试官：hashmap的get操作

5.面试官：hashmap的put操作

6.面试官：平时在使用HashMap时一般使用什么类型的元素作为Key？

7.面试官：如果让你实现一个自定义的class作为HashMap的key该如何实现？

参考

8.面试官：hashcode equal

9.面试官：HashMap是线程安全的吗？ 如果多个线程操作同一个HashMap对象会产生哪些非正常现象？

10.面试官：HashMap中bucket的大小为什么是2的幂？

11.面试官：为什么HashMap中负载因子子是0.75？

12.面试官：HashMap 和 Hashtable 的区别

猜你喜欢

1.面试官：HashMap的底层实现（如何解决hash冲突，负载因子）

9.面试官：HashMap是线程安全的吗？如果多个线程操作同一个HashMap对象会产生哪些非正常现象？