当前位置: 首页 > news >正文

有向图的强连通分量: Kosaraju算法和Tarjan算法详解

在上一篇文章中, 我们了解了图的最小生成树算法. 本节我们来学习 图的强连通分量(Strongly Connected Component, SCC) 算法.

什么是强连通分量?

有向图 中, 若一组节点内的任意两个节点都能通过路径互相到达(例如 A → B A \rightarrow B AB B → A B \rightarrow A BA), 则这组节点构成一个强连通分量. 它是图中的最大独立连通单元, 可以看作一种对有向图结构的深层划分.


环境要求

本文所用样例在Windows 11以及Ubuntu 24.04上面编译通过.

  1. Windows: 使用[Visual Studio],
  2. Ubuntu: 使用 Clang 18.1.3. (Ubuntu 24.04 系统安装版本)
  3. GCC 无法编译直接本项目代码, 因为本文代码使用了 C++20 Module, 而 GCC 对此支持不完整.

关于 Module 的更多信息, 请参考我之前的博客: CMake 构建 C++20 Module 实例(使用 MSVC)

本项目工程目录: 图论代码


基础概念

在深入算法之前, 我们需要明确几个关键术语和背景知识.

有向图与强连通性

  • 强连通性(Strong Connectivity): 若图中任意两节点均能互相到达(即存在 A → B A \rightarrow B AB , B → A B \rightarrow A BA的路径), 则该图是强连通的.

    connected graph

    上图中任意两点都是强连通的.

  • 强连通分量(SCC): 有向图的子集, 其内部节点强连通, 且无法再添加任何其他节点仍保持强连通性(即"最大性").

    scc

    上图中强连通分量为 {1, 2, 3}


逆图(Transpose Graph)

将原图所有边的方向反转后得到的新图. 例如, 若原图有边 A → B A \rightarrow B AB, 逆图中则为: B → A B \rightarrow A BA. 在 Kosaraju 算法中, 逆图帮助定位 SCC 的"边界".

transpose


缩点(Condensation)与 DAG

缩点操作是将每个 SCC 合并为一个超级节点, 原图中 SCC 间的边简化为超级节点间的边. 缩点后的图无环路, 这一特性在拓扑排序中至关重要. 通过缩点, 复杂图的分析可简化为对 DAG 的操作(例如路径查找或依赖解析).
condensation


3. Kosaraju 算法详解

Kosaraju 算法是计算强连通分量(SCC)的高效算法, 时间复杂度为 O ( V + E ) O(V + E) O(V+E)(线性时间). 其核心思想通过两次深度优先搜索(DFS)实现, 结合逆图(Transpose Graph)和栈(Stack)的特性, 逐层剥离 SCC.

算法步骤

  1. 第一次 DFS: 标记节点完成顺序

    • 对原图进行深度优先搜索, 按节点完成遍历的逆序将节点压入栈(即最后完成的节点在栈顶).
    • 关键作用: 确保后续处理时, 从"最晚完成"的节点(即潜在 SCC 的"根")开始, 保证 SCC 的完整性.
  2. 构建逆图

    • 将原图所有边的方向反转, 生成逆图(Transpose Graph).
  3. 第二次 DFS: 提取 SCC

    • 按栈中节点的顺序, 依次从栈顶取出节点, 对逆图进行 DFS.
    • 每轮 DFS 访问的节点构成一个 SCC.
原理剖析
  • 为何需要逆图?
    SCC 的强连通性在逆图中保持不变, 但逆图的遍历顺序能天然隔离不同 SCC 的边界.

    • 例如, 原图中存在 A→B, 逆图中则为 B→A. 若 AB 属于同一 SCC, 逆图的 DFS 仍能覆盖两者; 若属于不同 SCC, 逆图的遍历顺序会避免跨分量污染.
  • 栈的作用
    第一次 DFS 的逆序栈隐含了原图的拓扑排序(忽略环路), 确保第二次 DFS 从"高层级"分量开始, 避免重复遍历.


伪代码实现

Kosaraju(G):// G 是一个有向图// Step 1: 对原图G执行深度优先搜索,并记录每个节点的完成时间finish_time = [] // 这里我们用一个列表存储按完成时间排序的节点visited = [false] * |V| // 初始化所有节点为未访问状态for each vertex u in G:if not visited[u]:DFS(G, u, visited, finish_time)// Step 2: 转置图G,得到G^TGT = transpose(G)// 重置访问标记数组visited = [false] * |V|// Step 3: 对转置后的图GT执行深度优先搜索,按照原图的完成时间顺序while finish_time is not empty:v = finish_time.pop() // 取出最后一个元素,即具有最大完成时间的节点if not visited[v]:// 打印或处理这个强连通分量print("SCC:")DFS(GT, v, visited) // 注意这里不需要更新finish_time// 深度优先搜索辅助函数
DFS(graph, start_vertex, visited, finish_time=None):visited[start_vertex] = truefor each neighbor in graph.adjacent(start_vertex):if not visited[neighbor]:DFS(graph, neighbor, visited, finish_time)if finish_time is not None:finish_time.append(start_vertex) // 在递归返回时记录节点

示例演示

假设原图如下(边为有向):

example

  1. 第一次 DFS: 假设遍历顺序为 A -> B -> C -> D -> E -> F, 栈中顺序为 栈底[F, E, D, C, B, A]栈顶.

    kosaraju first dfs

  2. 构建逆图: 所有边反转.
    kosaraju transpose

  3. 第二次 DFS: 依次弹出栈顶元素处理, 并 DFS 逆图:

    • A 出发, DFS 访问 A -> C -> B, 组成 SCC {A, B, C}.


http://www.mrgr.cn/news/91582.html

相关文章:

  • 解锁机器学习核心算法|主成分分析(PCA):降维的魔法棒
  • 如何写架构设计⽂档
  • Flutter - 初体验
  • Django 连接(sqlserver)数据库方法
  • C# 背景 透明 抗锯齿 (效果完美)
  • 基于Flask的第七次人口普查数据分析系统的设计与实现
  • 整理一些安装环境的常用命令
  • python的类与对象。为什么有些东西要用到类和对象。普通的编程方式不行吗?
  • 电容的温度系数分析
  • CSDN文章质量分查询系统【赠python爬虫、提分攻略】
  • javaSE学习笔记23-线程(thread)-总结
  • JavaScript中判断元素是否在可视区域内
  • 机器学习实战(7):聚类算法——发现数据中的隐藏模式
  • deepseek-r1系列模型部署分别需要的最低硬件配置
  • frameworks 之 Activity添加View
  • 【愚公系列】《Python网络爬虫从入门到精通》022-Splash的爬虫应用
  • C++17 中的 std::uncaught_exceptions:异常处理的新利器
  • 数学推理中在推理规模化下检查假阳性解
  • Windows 图形显示驱动开发-IoMmu 模型
  • 关于 BK3633 上电时受串口 UART2 影响而无法启动的问题说明