当前位置: 首页 > news >正文

大数据数仓实战项目(离线数仓+实时数仓)3

1.课程内容和课程目标

2.订单时间维度指标需求分析

根据时间数据,生成一个时间维度表,我们后面还可以去复用这个时间维度表

3.使用kettle生成日期维度数据

Hive创建日期维度表

使用Kettle构建以下组件结构图

使用kettle生成日期维度数据插入到我们的hive表中

我们这边是生成了365条(一年365天)空数据

增加序列就是加上行号

就是现在有365条数据,然后我们给他打上行号

我们从1接收数据,经过2的代码处理,以3的格式输出

上面就生成了2019年所有日期(365天所有的)的信息

上面的操作一般一年搞一次就行了

4.创建ads层数据表

创建ads层数据表

统计半年期间每个季度的销售订单笔数、订单总额

5.订单指标时间维度-每个月-每个周-休息日-节假日-工作日

统计2019年期间每个月的销售订单笔数、订单总额

6.订单指标区域维度和分类维度需求分析

需求分析

下面是组织结构表

我们的订单表和组织结构表之间没有直接的关联(绿色)

我们要将其一层层连起来

下面是商品订单表

我们的商品订单表和组织结构表之间同样没有直接的关联(蓝色)

我们要将其一层层连起来

创建 dw 层数据表

fact_order_goods_wide

dim_goods_cat

dim_shops

dim_payment

创建 ads 层数据表

7.店铺区域维度数据拉宽

ods层数据至dw层

dw层数据维度拉宽

数据维度表拉宽

区域店铺维度数据拉宽(dim_shops)

我们上面创建的dim_shops就是用来存放这个数据

将数据插入dim_shops表中

8.商品分类维度数据拉宽(dim_goods_cat)

9.事实表维度数据拉宽操作(fact_order_goods_wide)

插入之后

去hive里面查询一下,验证一下数据

10.全国无商品分类维度指标统计

支付方式维度表拉宽(dim_payment)

指标计算汇总计算

全国、无商品分类维度的交易信息

指标算好之后,我们要进行一个保存

我们创建一个ads层的表

11.全国一级商品分类维度指标开发

不分支付类型

分支付类型

12.大区一级商品分类维度指标统计

大区、一级商品分类维度交易信息

其余的就不讲了

13.用户订单行为指标需求分析

需求分析

创建dw层表

14.ETL处理-订单时间标志宽表处理

加载用户维度数据

将ods中itcast_users的user信息插入到上面创建好的dw中dim_user表中

时间近30天、90天、180天、订单上午、下午时间拉宽

表创建好以后

将数据插入

15.用户订单行为指标开发

16.指标开发第二部分

17.指标开发第四部分

18.创建ads层指标表存储数据


http://www.mrgr.cn/news/89876.html

相关文章:

  • Java使用aspose实现pdf转word
  • 如何在C++ QT 程序中集成cef3开源浏览器组件去显示网页?
  • 在Ubuntu下编译VLC
  • 探索高效图像识别:基于OpenCV的形状匹配利器
  • C# 小说阅读 文本文件阅读
  • unity免费资源2025-1-26
  • vscode卡住---回退版本解决
  • 快速上手Vim的使用
  • 02DevOps基础环境准备
  • Excel 融合 deepseek
  • 深入Linux系列之进程地址空间
  • 基于机器学习时序库pmdarima实现时序预测
  • NetCore Consul动态伸缩+Ocelot 网关 缓存 自定义缓存 + 限流、熔断、超时 等服务治理 + ids4鉴权
  • SQL Server 数据库迁移到 MySQL 的完整指南
  • 在 Navicat 17 中扩展 PostgreSQL 数据类型 | 复合类型
  • openAI官方prompt技巧(一)
  • ubuntu 本地部署deepseek r1 蒸馏模型
  • AlwaysOn 可用性组副本所在服务器以及该副本上数据库的各项状态信息
  • .net的一些知识点6
  • C++效率掌握之STL库:string函数全解
  • 【Unity2D 2022:UI】创建滚动视图
  • DeepSeek:探索人工智能的新边界
  • 【csp/信奥赛C++语法学习如何入门?】
  • 【DeepSeek论文精读】2. DeepSeek LLM:以长期主义扩展开源语言模型
  • 循环神经网络
  • 【2】Cisco SD-WAN 组件介绍