当前位置: 首页 > news >正文

浅议Flink lib包下的依赖项

 

要开始一个 Flink 作业,通常需要如下依赖项:

1.Flink API,用来开发你的作业
2.连接器和格式,以将你的作业与外部系统集成 比如kakfa,hbase模块
3.若要开发自定义功能,还要添加必要的第三方依赖项比如fastjson等

其中1所需要的依赖已经在安装包lib文件夹下的flink-dist_xx.jar中,在IDEA等中编译程序时需要将相关依赖置为 provied。2、3则需要将应用程序代码及其所有需要的依赖项打包到一个 jar-with-dependencies 的 jar 包中。

关于flink-dist_xx.jar

flink-dist_xx.jar(下图黄色框)是 Flink 自身运行时所需的一组核心类和依赖,涵盖以下内容:

  • 协调和网络通讯

  • Checkpoint 和容错处理

  • API 和算子(如窗口操作)

  • 资源管理等

这些类和依赖构成了 Flink 运行时的核心。为了保持足够的精简,这个 JAR 不包含连接器和特定类库(如 CEP、SQL、ML 等)。

cd65cffda602a04854f5594e166e4156.jpeg

/lib 目录的其他依赖

/lib 目录中还包括一些常用模块的 JAR 文件,例如:

  • Table 模块(上图绿色框)

  •  数据格式支持模块(如 CSV、JSON 格式)

这些模块默认情况下会被自动加载。如果希望禁止加载某些模块,只需将对应的 JAR 文件从 classpath 的 /lib 目录中移除。

/opt目录中的可选依赖

Flink 还在 /opt 文件夹中提供了额外的可选依赖项。需要启用时,可以将这些 JAR 文件移动到 /lib 目录中进行加载。

d56282d42b253962ad0ec377c8fefaba.jpeg


http://www.mrgr.cn/news/80267.html

相关文章:

  • Vivado生成比特流时opt_design跑了很久;Vivado Implementation缺少一些逻辑的实现;一些逻辑被优化
  • 鸿蒙生态的崛起:开发实践、认证路径与激励策略
  • Nginx性能优化全方案:打造一个高效服务器
  • Prometheus 告警规则设计规范
  • 【软件工程】第四章·需求分析
  • linux下解压文件夹
  • Mybatisplus教学
  • 基线检查:Windows安全基线.【手动 || 自动】
  • SQL server学习05-查询数据表中的数据(上)
  • gorm源码解析(二):核心设计与初始化
  • 计算机网络知识点全梳理(二.HTTP知识点总结)
  • PostgreSQL JSON/JSONB 查询与操作指南
  • git使用教程(超详细)-透彻理解git
  • 计算机网络知识点全梳理(一.TCP/IP网络模型)
  • Python自动化操作文档系列
  • 【Flink-scala】DataStream编程模型之延迟数据处理
  • vscode+msys2+clang+xmake c++开发环境搭建
  • 2024CAT开发测试 Web应用赛道
  • Nginx配置示例教程
  • ARM64平台实时linux操作系统xenomai4(EVL)构建安装简述
  • 使用rust语言创建python模块(pyo3+maturin)
  • 高等动力学中的正则变换
  • 在 macOS 下安装和使用 Clang Static Analyzer
  • 哈希【C++实现】
  • 2024年底-Sre面试回顾
  • 使用create-react-app创建工程时报错处理