当前位置: 首页 > news >正文

【Apache Paimon】-- 2 -- 核心特性 (0.9.0)

目录

1、实时更新

1.1、实时大批量更新

1.2、支持定义合并引擎

1.3、支持定义更新日志生成器

2、海量数据追加处理

2.1、append table

2.2、快速查询

     3、数据湖功能(类比:hudi、iceberg、delta)

3.1、支持 ACID 事务

3.2、支持 Time travel(时间旅行)

3.3、支持 Schema Evolution(元数据变更)

3.4、可扩展元数据:存储 PB 级大规模数据集和存储大量分区

3.4.1、表级别的元数据管理

3.4.2、架构可扩展性

3.4.3、自定义扩展

3.4.4、版本管理和一致性

3.4.5、与其他系统的兼容性

3.5、分区过期设置

4、参考


1、实时更新

1.1、实时大批量更新

         通过 Flink streaming 可以实现 primary key 表的实时大批量更新。

1.2、支持定义合并引擎

        用户可以随心所欲地更新记录。复制以保留最后一行,或部分更新,或汇总记录,或第一行,提供了很灵活的处理方式,总之可以用户自己决定。

        主键表的数据更新提供了以下合并机制:


http://www.mrgr.cn/news/77692.html

相关文章:

  • 什么是 Faiss?
  • java基础概念37:正则表达式2-爬虫
  • HarmonyOs鸿蒙开发实战(20)=>一文学会基础使用组件导航Navigation
  • 46.坑王驾到第十期:vscode 无法使用 tsc 命令
  • Elasticsearch 的索引管理与映射配置实战
  • Qt 日志文件的滚动写入
  • 前端-react(class组件和Hooks)
  • 测试工程师如何在面试中脱颖而出
  • Predicting Human Scanpaths in Visual Question Answering
  • Palo Alto Networks PAN-OS身份认证绕过漏洞复现(CVE-2024-0012)
  • 编程语言05:面向对象
  • Linux:confluence8.5.9的部署(下载+安装+pojie)离线部署全流程 遇到的问题
  • npm上传自己封装的插件(vue+vite)
  • 山东春季高考-C语言-综合应用题
  • DatePicker 日期选择器的使用(当日、近一周、近一月...)
  • SpringBoot集成 Jasypt 实现数据源连接信息进行加密
  • 视频对接rtsp协议学习
  • Elasticsearch是如何实现Master选举的?
  • transformer.js(一):这个前端大模型运行框架的可运行环境、使用方式、代码示例以及适合与不适合的场景
  • Altium Designer学习笔记 6-10 异性元件库创建_原理图绘制
  • 【Linux清空显存占用】Linux 系统中清理 GPU 显存
  • PostgreSQL 性能优化全方位指南:深度提升数据库效率
  • React基础知识一
  • 论文复现_How Machine Learning Is Solving the Binary Function Similarity Problem
  • 解决 Android 单元测试 No tests found for given includes:
  • golang调用webview,webview2,go-webview2