当前位置: 首页 > news >正文

【Flink运行时架构】核心组件

在Flink的运行架构中,有两大比较重要的组件:作业管理器(JobManager)和任务管理器(TaskManager)。
Flink的作业提交与任务处理时的系统如下图所示。在这里插入图片描述
其中,客户端并不是处理系统的一部分,只是负责作业提交,在作业提交之后,可选择与JobManager断开连接。接下来,重点介绍一下JobManager和TaskManager在整个过程中所扮演的角色。

JobManager

JobManager是Flink集群中一个任务管理和调度的核心,是控制应用执行的主进程,每一个应用都应该被唯一的JM控制执行。在高可用的场景下,可能会出现多个JM,但是也只有一个正在运行的Leader节点,其余都是备用。JM又包含三个组件:JobMaster、ResourceManager、Dispatcher。

JobMaster

我们把对数据进行处理的操作统称为任务(task),多个任务按照一定的先后顺序连接起来,就构成了作业(job)。而JobMaster是负责处理单独的作业,因此JobMaster和具体的job是一一对应的。
也就是说,多个job是可以运行在一个Flink集群上的,而每一个job则都有一个自己的JobMaster。
JobMaster在接收到客户端提交的应用后,会把作业图转换成一个物理层面的数据流图,也就是执行图,它包含了所有可以并发执行的任务。JobMaster会向资源管理器发出请求,申请执行任务必要的资源,一旦获取了足够资源,就会将执行图分发到真正运行他们的TaskManager上。

ResourceManager

ResourceManager主要负责资源的分配和管理,在Flink集群中只有一个。这里的资源是指TaskManager的任务槽(slot),它包含了机器用来执行计算的一组CPU和内存。每个任务都需要被分配到一个任务槽中执行。

这里的ResourceManager其实是Flink内置的,注意和其他资源管理平台区分开,比如K8S、YARN等。
TaskManager中的任务槽都会向ResourceManager注册的,当ResourceManager没有足够的任务槽时,它可以向资源管理平台发起会话,请求提供启动TaskManager进程的容器。

Dispatcher

Dispatcher主要负责提供一个REST接口,用来与集群进行交互和管理,负责为每一个新提交的作业启动一个新的JobMaser组件,以及启动一个WebUI用于展示和监控作业执行信息。

TaskManager

每个TaskManager都包含了一定数量的任务槽,任务槽是资源调度的最小单位,其数量限制了TaskManager能够并发处理的任务数量。
TaskManager启动之后,会向ResourceManager注册它的任务槽,收到指令后,TaskManager就会将一个或者多个任务槽提供给JobMaster用于分配任务的调用。


http://www.mrgr.cn/news/98105.html

相关文章:

  • AI编程案例拆解|基于机器学习XX评分系统-前端篇
  • 汇编获取二进制
  • Linux基础14
  • 解决2080Ti使用节点ComfyUI-PuLID-Flux-Enhanced中遇到的问题
  • 2019年计算机真题
  • 小刚说C语言刷题——第22讲 二维数组
  • 【学习笔记】两个类之间的数据交互方式
  • 可配置多功能门芯片的12种用法推导——基于74LVC1G97芯片(附1G98、1G57、1G58、1G99用法)
  • 470用 Rand7() 实现 Rand10()
  • leetcode572 另一棵树的子树
  • 每天学一个 Linux 命令(14):cat
  • Linux进程概念
  • 【MQTT-协议原理】
  • 2025蓝桥杯算法竞赛深度突破:创新题型与高阶策略全解析
  • IIC通信协议
  • 基于 Maven 构建的 Thingsboard 3.8.1 项目结构
  • 部署NFS版StorageClass(存储类)
  • 文献总结:AAAI2025-UniV2X-End-to-end autonomous driving through V2X cooperation
  • SAP系统客户可回收包材库存管理
  • 强化学习系统在复杂推理模型中的应用——以AReaL系统为例