当前位置: 首页 > news >正文

深入解析 helpTransfer 方法:多线程协作中的哈希表扩容

在这里插入图片描述

文章目录

    • 什么是哈希表
    • 哈希表的问题:扩容
    • 扩容的挑战
    • 扩容的原理
    • `helpTransfer` 方法
      • 检查是否正在扩容
      • 生成扩容标记并检查条件
      • 判断是否需要更多线程帮助
      • 加入搬家工作
      • 返回新表或旧表

什么是哈希表

哈希表(HashMap)是一种常用的数据结构,它通过“键值对”的形式来存储数据。它的核心思想是:根据每个“键”(key)的特征,通过一种叫做哈希函数的计算,把这个键映射到一个位置(格子)上。这样,我们就能快速找到或存储对应的值(value)。

打个比方:假设你有一个大抽屉(哈希表),你要把很多标有标签的物品放进去。你根据物品的标签(键),使用一个“算法”决定这个物品应该放在哪个小格子(具体位置)。

哈希表的问题:扩容

随着我们不断往哈希表里添加数据,格子会逐渐装满,并且有时不同的键会被放到同一个格子里(称为“哈希冲突”)。为了避免这些问题,哈希表有一个机制,当装入的元素数量超过一定的阈值时,它会 扩容,即换一个更大的表,把所有的键值对重新整理放进去。

打个比方:当你的抽屉里东西太多,而且标记不清时,你决定换一个更大的抽屉,并把物品重新整理好。

扩容的挑战

扩容本质上是需要把所有数据从旧的哈希表(旧抽屉)搬到新的哈希表(新抽屉)里。这在单线程的情况下还算简单,但如果有多个线程(搬运工)同时在操作这个哈希表,问题就变复杂了。我们希望多个线程可以协同工作,把数据快速、正确地搬到新表里。

打个比方:你和几个朋友(多个线程)决定一起搬家。问题是,如果没有协调好,大家可能会重复搬运某个物品,甚至搞混了物品的摆放位置。

扩容的原理

  1. 创建一个新的、更大的哈希表:我们要有一个新的抽屉,来装更多的东西。
  2. 重新分配每个键值对的位置:根据新的哈希表(新的抽屉)的大小,重新计算每个键值对应该放到哪个格子里。
  3. 多个线程协同搬运:多个线程一起工作,把旧哈希表中的数据搬运到新的哈希表中,保证每个线程只搬运自己负责的部分。

helpTransfer 方法

final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {Node<K,V>[] nextTab; int sc;if (tab != null && (f instanceof ForwardingNode) &&(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {int rs = resizeStamp(tab.length) << RESIZE_STAMP_SHIFT;while (nextTab == nextTable && table == tab &&(sc = sizeCtl) < 0) {if (sc == rs + MAX_RESIZERS || sc == rs + 1 ||transferIndex <= 0)break;if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {transfer(tab, nextTab);break;}}return nextTab;}return table;
}

helpTransfer 方法是 ConcurrentHashMap 中扩容相关的一个方法。

helpTransfer 方法的作用是:在哈希表扩容过程中,多个线程协同工作,把旧哈希表的数据搬运到新的哈希表中。

接下来,我们会解释这个方法的功能是如何实现的。

检查是否正在扩容

if (tab != null && (f instanceof ForwardingNode) &&(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {

解释:这个方法首先检查,当前哈希表是否正在进行扩容。

  • tab != null:当前哈希表必须存在。
  • f instanceof ForwardingNode:当前节点 f 是否是 ForwardingNode,这个节点表明哈希表正在扩容。
  • nextTab != null:是否已经创建了新的哈希表(新抽屉)。

打个比方:这就像我们检查当前抽屉是不是已经在搬家,如果是,那我们可以决定是否加入搬家队伍。

生成扩容标记并检查条件

int rs = resizeStamp(tab.length) << RESIZE_STAMP_SHIFT;
while (nextTab == nextTable && table == tab &&(sc = sizeCtl) < 0) {

解释:

  • resizeStamp(tab.length):生成一个标记,用来标识这次扩容。
  • 进入 while 循环:检查当前扩容状态。
    • nextTab == nextTable && table == tab:确认新旧哈希表没有变化,扩容工作还在进行。
    • sizeCtl < 0:检查扩容是否真的还在进行。

打个比方:这一步是保证当前的搬家工作没有被打断,你可以加入搬运队伍。

判断是否需要更多线程帮助

if (sc == rs + MAX_RESIZERS || sc == rs + 1 ||transferIndex <= 0)
break;

解释:此处判断是否还需要更多线程来帮助搬运。

  • 如果正在帮忙的线程已经够多了(sc == rs + MAX_RESIZERS),或者扩容快完成了(sc == rs + 1),当前线程就不再加入。
  • 如果所有桶(格子)都已经搬完了(transferIndex <= 0),那也不需要继续搬了。

打个比方:这是在判断是否已经有足够多的朋友在帮忙搬家,或者工作快要结束。如果不需要更多人手,你就不必加入。

加入搬家工作

if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {transfer(tab, nextTab);break;
}

解释:

  • compareAndSwapInt 是一种原子操作,它会尝试增加 sizeCtl,表示当前线程加入搬运工作。
  • 如果成功加入,线程会调用 transfer 方法,开始实际搬运数据。

打个比方:这里就是实际的搬运操作。当你加入搬家队伍后,开始负责自己的一部分,把旧抽屉的东西搬到新抽屉里。

返回新表或旧表

return nextTab;

解释:如果搬运工作完成,返回新的哈希表 nextTab。如果还没有完成,则返回旧哈希表。

打个比方:搬完东西后,你可以开始使用新的抽屉。如果没有搬完,那还继续用旧的抽屉。

在这里插入图片描述


http://www.mrgr.cn/news/35678.html

相关文章:

  • java启动参数JAVA OPT不生效问题
  • Ollama在Windows安装,使用,简单调用API
  • 鸿蒙之setTimeout问题
  • 高级算法LLM大语言模型算法特训 带你转型AI大语言模型算法工程师
  • 大模型分布式训练并行技术(二)-数据并行
  • 最大似然估计,存在即合理
  • Vue+Tui-image-editor实现图片编辑(涂鸦,裁剪,标注,旋转,滤镜)
  • pdf.js滚动翻页的例子
  • 系统架构设计师教程 第9章 9.1 软件可靠性基本概念 笔记
  • 瑞芯微RK3566鸿蒙开发板Android11修改第三方输入法为默认输入法
  • 详解BIOS
  • LeetCode题练习与总结:删除链表中的节点--237
  • 基于Jeecgboot3.6.3的flowable流程视图增加一个节点显示方式
  • 算法记录——树
  • python的while嵌套循环练习
  • 01DSP学习-了解DSP外设-以逆变器控制为例
  • Java后端中的复杂查询优化:索引设计与SQL调优的结合
  • 两张图讲透软件测试实验室认证技术体系与质量管理体系
  • P2415 集合求和
  • MATLAB中isa函数用法