当前位置: 首页 > news >正文

Iceberg 表不能用 Show Partitions 显示分区信息

总结:

  1. Iceberg 表不能用 Show Partitions 显示分区信息
  2. 插入 iceberg 的速度并不比插入正常表的速度快。
    启动命令
spark-sql \--conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions \--conf spark.sql.catalog.spark_catalog=org.apache.iceberg.spark.SparkSessionCatalog \--conf spark.sql.catalog.spark_catalog.type=hive

iceberg 表

CREATE TABLE iceberg.inventory (inv_item_sk INT,inv_warehouse_sk INT,inv_quantity_on_hand INT,inv_date_sk INT)USING iceberg
PARTITIONED BY (inv_date_sk);insert  into iceberg.inventory select * from tpcds_sf1000_withdecimal_withdate_withnulls.inventory;

插入语句指向性时间 Time taken: 338.963 seconds;

iceberg 格式的表查不到分区信息

show partitions spark_catalog.iceberg.inventory;
[INVALID_PARTITION_OPERATION.PARTITION_MANAGEMENT_IS_UNSUPPORTED] The partition command is invalid. Table `spark_catalog`.`iceberg`.`inventory` does not support partition management.; line 1 pos 16;
ShowPartitions [partition#161]
+- ResolvedTable org.apache.iceberg.spark.SparkSessionCatalog@2af1bf5a, iceberg.inventory, spark_catalog.iceberg.inventory, [inv_item_sk#162, inv_warehouse_sk#163, inv_quantity_on_hand#164, inv_date_sk#165]

parquet 格式

CREATE TABLE iceberg.inventory_parquet (inv_item_sk INT,inv_warehouse_sk INT,inv_quantity_on_hand INT,inv_date_sk INT)USING parquet
PARTITIONED BY (inv_date_sk);insert  into iceberg.inventory_parquet select * from tpcds_sf1000_withdecimal_withdate_withnulls.inventory;spark-sql (iceberg)> insert  into iceberg.inventory_parquet select * from tpcds_sf1000_withdecimal_withdate_withnulls.inventory;

插入语句指向性时间 Time taken: 329.275 seconds


http://www.mrgr.cn/news/34090.html

相关文章:

  • 平安人寿山西分公司:践行绿色金融,开启绿色新篇章
  • 模型压缩概览
  • 第3篇 滑动开关控制LED__ARM汇编语言工程<一>
  • Vue.js 高质量翻页功能的完整开发指南
  • VSCode本地C/C++环境配置
  • RabbitMQ 在 Java 和 Spring Boot 中的应用详解
  • 路径处理 | 关键点提取之Douglas–Peucker算法(附ROS C++/Python实现)
  • 数据分析:主成分以及贡献变量解析
  • PMP培训机构,雷区注意绕行
  • 防火墙详解(二)通过网页登录配置华为eNSP中USG6000V1防火墙
  • 力扣 困难 154.寻找旋转排序数组中的最小值 II
  • 【PostgreSQL】PostgreSQL数据库允许其他IP连接到数据库(Windows Linux)
  • C++之Count类
  • 语音合成(自然、非自然)
  • doris的be节点buff/cache 持续增大问题
  • 神经网络(一):神经网络入门
  • 【C语言进阶】第四节:自定义类型详解
  • LDO选型
  • HarmonyOS---权限和http/Axios网络请求
  • JMeter(需要补充请在留言区发给我,谢谢)
  • docker部署Stirling-PDF
  • es高级查询——多字段聚合
  • 75、Python之函数式编程:生成器的核心方法及更多使用场景
  • 文科生学pytorch——一些概念的解释
  • layui upload.render 设置文件名
  • 基于Python+SQLServer实现(界面)书店销售管理管理子系统