当前位置: 首页 > news >正文

【Hadoop实训】Hive 数据操作①

目录

一、准备文件

1、创建表

2、 数据映射

二、HIVE的数据操作

   1、基本查询

        a、全表查询

        b、选择特定字段查询 

        c、查询员工表总人数

        d、查询员工表总工资额 

        e、查询5条员工表的信息

2、Where条件查询

        a、查询工资等于5000的所有员工

        b、查询工资在500到1000的员工信息

        c、查询comm为空的所有员工信息

        d、查询工资是1500和5000的员工信息

3、Liket 和 Rlike

        a、查找工资以2开头的员工信息

        b、查找工资的第二个数值为2的员工信息

        c、查找工资中含有2的员工信息


一、准备文件

1、创建表

        准备两个文件emp.txt和dept.txt

        创建表(在hive上操作)  ,先进入itcast 命令:

use itcast;create table emp(empno int,ename string,job string,mgr int,hiredate string,sal double,comm double,deptno int)row format delimited fields  terminated by '\t';create table dept(deptno int,dname string,loc int) row format delimited fields  terminated by '\t';

2、 数据映射

        创建表完成后,将数据文件移动到对应的HDFS路径下,完成数据映射。 

二、HIVE的数据操作

   1、基本查询

        a、全表查询

select * from emp;

        b、选择特定字段查询 

select deptno,dname from dept;

        c、查询员工表总人数

select count(*) cnt from emp;

 

        d、查询员工表总工资额 

select sum(sal) sum_sal from emp;

 

        e、查询5条员工表的信息

select * from emp limit 5;

2、Where条件查询

        a、查询工资等于5000的所有员工

select * from emp where sal=5000;

        b、查询工资在500到1000的员工信息

select * from emp where sal between 500 and 1000;

        c、查询comm为空的所有员工信息

select * from emp where comm is null;

        d、查询工资是1500和5000的员工信息

select * from emp where sal IN (1500,5000);

3、Liket 和 Rlike

        a、查找工资以2开头的员工信息

select * fcom emp where sal LIKE '2%';

        b、查找工资的第二个数值为2的员工信息

hive> select * from emp wheresal LIKE ‘_2%’;

        c、查找工资中含有2的员工信息

select * from cmp where sal RLIKE ‘ [2] ‘;

此模块分为两篇文章哦,继续学习请参考以下链接:【Hadoop实训】Hive 数据操作②-CSDN博客


http://www.mrgr.cn/news/69768.html

相关文章:

  • 秃姐学AI系列之:样式迁移 + 代码实现
  • 719. 找出第 K 小的数对距离
  • 基于Spring Boot与Redis的令牌主动失效机制实现
  • node.js安装和配置教程
  • 杨中科 .Net Core 笔记 DI 依赖注入2
  • Unity类银河战士恶魔城学习总结(P117 Ice And Fire Item Effec 制作一把冰火属性的剑)
  • 全面解析 Python typing模块与静态类型注解:从基础到高级
  • 寻找伤感短视频素材 这些网站帮你轻松下载无水印资源
  • 图片搜索引擎,来快速实现一个高性能的本地图片搜索引擎
  • 《浔川 AI 翻译 v3.0 或面临取消发布困境》
  • 【VScode】Html+Css+JavaScript学习计划表
  • 《TCP/IP网络编程》学习笔记 | Chapter 7:优雅地断开套接字连接
  • 医院一体化监控运维:保障医疗信息化稳定运行的智慧之选
  • 【优选算法 — 滑动窗口】最大连续1的个数 将 x 减到0的最小操作数
  • 打开MATLAB报错,名称不存在或不是目录?
  • Spring Boot与工程认证:计算机课程管理的新范式
  • Linux【基础篇】T
  • DAY24|回溯算法Part03|LeetCode:93.复原IP地址、78.子集、90.子集II
  • 【日记】清仓了三个基金(1199 字)
  • MyBatisPlus 用法详解
  • 解决:this is incompatible with sql_mode=only_full_group_by
  • k8s集群安装(kubeadm)
  • pb105使用ado.net接口提示缺少sybase.powerbuilder.db
  • 4-3-2.C# 数据容器 - Dictionary 扩展(Dictionary 存储对象的特性、Dictionary 与数组的转换)
  • 布什各门,C站怎么没通知我就把文章改为VIP文章了?
  • Sigrity SPEED2000 Power Ground Noise Simulation模式如何进行信号时域仿真操作指导(一)-单个信号