我们知道 HashMap 底层是一个 Entry 数组,当发生 hash 冲突的时候,HashMap 是采用链表的方式来解决的,在对应的数组位置存放链表的头结点。对链表而言,新加入的节点会从头结点加入。javadoc 中有一段关于 HashMap ...
我们知道 HashMap 底层是一个 Entry 数组,当发生 hash 冲突的时候,HashMap 是采用链表的方式来解决的,在对应的数组位置存放链表的头结点。对链表而言,新加入的节点会从头结点加入。javadoc 中有一段关于 HashMap 的描述:
可以看出,解决 HashMap 线程安全问题的方法很简单,下面我简单分析一下可能会出现线程问题的一些地方。 1. 向HashMap中插入数据的时候在 HashMap 做 put 操作的时候会调用到以下的方法: //向HashMap中添加Entryvoid addEntry(int hash, K key, V value, int bucketIndex) { if ((size >= threshold) && (null != table[bucketIndex])) { resize(2 * table.length); //扩容2倍 hash = (null != key) ? hash(key) : 0; bucketIndex = indexFor(hash, table.length); } createEntry(hash, key, value, bucketIndex); }//创建一个Entryvoid createEntry(int hash, K key, V value, int bucketIndex) { Entry<K,V> e = table[bucketIndex];//先把table中该位置原来的Entry保存 //在table中该位置新建一个Entry,将原来的Entry挂到该Entry的next table[bucketIndex] = new Entry<>(hash, key, value, e); //所以table中的每个位置永远只保存一个最新加进来的Entry,其他Entry是一个挂一个,这样挂上去的 size++; } 现在假如 A 线程和 B 线程同时进入 addEntry,然后计算出了相同的哈希值对应了相同的数组位置,因为此时该位置还没数据,然后对同一个数组位置调用 createEntry,两个线程会同时得到现在的头结点,然后 A 写入新的头结点之后,B 也写入新的头结点,那 B 的写入操作就会覆盖A的写入操作造成 A 的写入操作丢失。 2. HashMap扩容的时候还是上面那个 addEntry 方法中,有个扩容的操作,这个操作会新生成一个新的容量的数组,然后对原数组的所有键值对重新进行计算和写入新的数组,之后指向新生成的数组。来看一下扩容的源码: //用新的容量来给table扩容 void resize(int newCapacity) { Entry[] oldTable = table; //保存old table int oldCapacity = oldTable.length; //保存old capacity // 如果旧的容量已经是系统默认最大容量了,那么将阈值设置成×××的最大值,退出 if (oldCapacity == MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return; } //根据新的容量新建一个table Entry[] newTable = new Entry[newCapacity]; //将table转换成newTable transfer(newTable, initHashSeedAsNeeded(newCapacity)); table = newTable; //设置阈值 threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1); } 那么问题来了,当多个线程同时进来,检测到总数量超过门限值的时候就会同时调用 resize操作,各自生成新的数组并 rehash 后赋给该 map 底层的数组 table,结果最终只有最后一个线程生成的新数组被赋给 table 变量,其他线程的均会丢失。而且当某些线程已经完成赋值而其他线程刚开始的时候,就会用已经被赋值的 table 作为原始数组,这样也会有问题。所以在扩容操作的时候也有可能会引起一些并发的问题。 3. 删除HashMap中数据的时候删除键值对的源代码如下: //根据指定的key删除Entry,返回对应的value public V remove(Object key) { Entry<K,V> e = removeEntryForKey(key); return (e == null ? null : e.value); } //根据指定的key,删除Entry,并返回对应的value final Entry<K,V> removeEntryForKey(Object key) { if (size == 0) { return null; } int hash = (key == null) ? 0 : hash(key); int i = indexFor(hash, table.length); Entry<K,V> prev = table[i]; Entry<K,V> e = prev; while (e != null) { Entry<K,V> next = e.next; Object k; if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) { modCount++; size--; if (prev == e) //如果删除的是table中的第一项的引用 table[i] = next;//直接将第一项中的next的引用存入table[i]中 else prev.next = next; //否则将table[i]中当前Entry的前一个Entry中的next置为当前Entry的next e.recordRemoval(this); return e; } prev = e; e = next; } return e; } 删除这一块可能会出现两种线程安全问题,第一种是一个线程判断得到了指定的数组位置i并进入了循环,此时,另一个线程也在同样的位置已经删掉了i位置的那个数据了,然后第一个线程那边就没了。但是删除的话,没了倒问题不大。 再看另一种情况,当多个线程同时操作同一个数组位置的时候,也都会先取得现在状态下该位置存储的头结点,然后各自去进行计算操作,之后再把结果写会到该数组位置去,其实写回的时候可能其他的线程已经就把这个位置给修改过了,就会覆盖其他线程的修改。 其他地方还有很多可能会出现线程安全问题,我就不一一列举了,总之 HashMap 是非线程安全的,在高并发的场合使用的话,要用 Collections.synchronizedMap 进行包装一下,或者直接使用 ConcurrentHashMap 都行。 关于 HashMap 的线程非安全性,就总结这么多,如有问题,欢迎交流,我们一同进步~ |
墨染ART / 2019-01-12
墨染ART / 2019-01-12
Wotchin / 2019-01-12
李政一 / 2019-01-12
李政一 / 2019-01-12