当前位置: 首页 > news >正文

大数据应用开发——大数据平台集群部署(四)

前言

大数据应用开发——大数据平台集群部署 

        安装虚拟机 

        集群基础设置

        在集群上安装jdk和hadoop

        安装mysql和hive

        安装spark和zookeeper、hbase

大数据应用开发——实时数据采集

大数据应用开发——实时数据处理

        Flink完成Kafka中的数据消费,将数据分发至Kafka的dwd层中

        并在HBase中进行备份

大数据应用开发——数据可视化

目录

        安装wget

        下载mysql5.7

        安装hive


在集群上安装mysqlhive

安装wget

查看系统版本及操作位数
[root@master ~]# cat /etc/centos-release
[root@master ~]# uname -m
下载安装包

阿里云镜像库 https://mirrors.aliyun.com/centos/7.9.2009/os/x86_64/Packages

wget-1.14-18.el7_6.1.x86_64.rpm

拷贝安装包进行安装
# 将下载好的wget安装包拷贝到对应的目录,然后cd到对应目录执行以下命令 
[root@master ~]# cd /home
[root@master home]# rpm -ivh wget-1.14-18.el7_6.1.x86_64.rpm
yum源处理

删除yum源

[root@master ~]# rm -rf /etc/yum.repos.d/*
下载阿里云yum源 http://mirrors.aliyun.com/repo/Centos-7.repo
拷贝yum源
# 把下载好的Centos-7.repo拷贝到/etc/yum.repos.d/下,没有该文件夹就手动新建一个
[root@master home]# cp Centos-7.repo /etc/yum.repos.d/
清除和生成yum缓存
# 清除缓存
[root@master home]# yum clean all
# 生成缓存
[root@master home]# yum makecache

下载mysql5.7

[root@master ~]# wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm
[root@master ~]# yum -y install mysql57-community-release-el7-10.noarch.rpm
[root@master ~]# rpm --import https://repo.mysql.com/RPM-GPG-KEY-mysql-2022
[root@master ~]# yum -y install mysql-community-server
[root@master ~]# 
启动mysql
# 启动mysql
[root@master ~]# systemctl start mysqld       
# 设置开机启动mysql 
[root@master ~]# systemctl enable  mysqld     
# 查看mysql状态
[root@master ~]# systemctl status mysqld      
查看mysql密码
[root@master ~]# grep "password" /var/log/mysqld.log
mysql更改密码策略并重新设置密码开启root用户远程访问
# 数据库初始化 Password123$ 修改密码 YYYNYY 修改过程
[root@master ~]# mysql_secure_installation
[root@master ~]# mysql -uroot -pPassword123$
mysql> SHOW VARIABLES LIKE 'validate_password%';
mysql> set global validate_password_policy=LOW;
mysql> set global validate_password_length=6;
mysql> ALTER USER 'root'@'localhost' IDENTIFIED BY '123456';
mysql> use mysql;
mysql> SELECT User,Host FROM user;
mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123456' WITH GRANT OPTION;
mysql> FLUSH PRIVILEGES;

安装hive

解压apache-hive-3.1.2-bin.tar.gz并且改名为hive
[root@master software]# tar -zxf /opt/software/apache-hive-3.1.2-bin.tar.gz -C /opt/module/
[root@master software]# mv /opt/module/apache-hive-3.1.2-bin/ /opt/module/hive
添加hive的环境变量
[root@master software]# vi /etc/profile.d/my-env.sh
#HIVE_HOME
export HIVE_HOME=/opt/module/hive
export PATH=$PATH:$HIVE_HOME/bin
source /etc/profile 使配置生效
[root@master software]# source /etc/profile
解决日志jar包冲突进⼊/opt/module/hive/lib目
[root@master lib # mv log4j-slf4j-impl-2.10.0.jar log4j-slf4j-impl-2.10.0.jar.bak
hive元数据配置到mysql

拷贝MySQLJDBC驱动到hivelib目录

[root@master lib]# cp /opt/softwares/mysql-connector-java-5.1.37.jar /opt/module/hive/lib/

配置hive-env.sh 

[root@master lib]# cd .
[root@master hive]# cd conf/
[root@master conf]# cp hive-env.sh.template hive-env.sh
[root@master conf]# vi hive-env.sh
export JAVA_HOME=/opt/module/jdk1.8.0_212
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export HIVE_HOME=/opt/module/hive
export HIVE_CONF_DIR=$HIVE_HOME/conf

配置MetaStoreMySQL

[root@master conf]# cp hive-default.xml.template hive-site.xml
[root@master conf]# vi hive-site.xml
5678dd删除所有
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration><property><name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://master:3306/hivedb?createDatabaseIfNotExist=true&amp;useSSL=false</value></property><property><name>javax.jdo.option.ConnectionDriverName</name><value>com.mysql.jdbc.Driver</value></property><property><name>javax.jdo.option.ConnectionUserName</name><value>root</value></property><property><name>javax.jdo.option.ConnectionPassword</name><value>123456</value></property><property><name>hive.cli.print.current.db</name><value>true</value></property><property><name>hive.cli.print.header</name><value>true</value></property><property><name>hive.metastore.schema.verification</name><value>false</value></property><property><name>hive.exec.mode.local.auto</name><value>true</value></property>
</configuration>

在mysql创建元数据库metastore

mysql> create database metastore;
Query OK, 1 row affected (0.00 sec)
mysql> exit

解决guava.jar冲突问题

[root@master lib]# rm -rf guava-19.0.jar
[root@master lib]# cp /opt/module/hadoop-3.1.3/share/hadoop/common/lib/guava-27.0-jre.jar /opt/module/hive/lib/
初始化元数据库
[root@master lib]# schematool -initSchema -dbType mysql -verbose

修改元数据库字符集,解决乱码问题

[root@master lib]# mysql -uroot -p123456
mysql> use hivedb;
Reading table information for completion of table and column names
You can turn off this feature to get a quicker startup with -A
Database changed
mysql> alter table COLUMNS_V2 modify column COMMENT varchar(256)
character set utf8;
Query OK, 0 rows affected (0.01 sec)
Records: 0 Duplicates: 0 Warnings: 0
mysql>alter table TABLE_PARAMS modify column PARAM_VALUE mediumtext
character set utf8;
启动hive客户端
[root@master ~]# hive

http://www.mrgr.cn/news/99137.html

相关文章:

  • 机器学习专栏(4):从数据饥荒到模型失控,破解AI训练的七大生死劫
  • 分布类相关的可视化图像
  • 基于maven-jar-plugin打造一款自动识别主类的maven打包插件
  • 单元测试的一般步骤
  • 20. git diff
  • 超简单的git学习教程
  • Spring Boot 项目中发布流式接口支持实时数据向客户端推送
  • 硬件电路(24)-NE555振荡电路
  • vue的基本结构
  • 用python脚本怎么实现:把一个文件夹里面.png文件没有固定名称,复制到另外一个文件夹按顺序命名?
  • 强制重装及验证onnxruntime-gpu是否正确工作
  • 【Rust 精进之路之第8篇-工具赋能】深入 Cargo:依赖管理、构建配置与工作空间 (Workspace)
  • 【TeamFlow】4 团队管理系统
  • 2.1 基于委托的异步编程方法
  • 2020 年 7 月大学英语四级考试真题(组合卷)——解析版
  • 计算机视觉cv2入门之视频处理
  • 硬件工程师笔记——电子器件汇总大全
  • AI书籍大模型微调-基于亮数据获取垂直数据集
  • 【Rust 精进之路之第11篇-借用·实践】切片 (Slices):安全、高效地引用集合的一部分
  • 车载测试用例开发-如何平衡用例覆盖度和测试效率的方法论