当前位置: 首页 > news >正文

本地部署Spark集群

部署Spark集群大体上分为两种模式:单机模式与集群模式

大多数分布式框架都支持单机模式,方便开发者调试框架的运行环境。但是在生产环境中,并不会使用单机模式。

下面详细列举了Spark目前支持的部署模式。

(1)Local模式:在本地部署单个Spark服务

(2)Standalone模式:Spark自带的任务调度模式。(国内不常用)

(3)YARN模式:Spark使用Hadoop的YARN组件进行资源与任务调度。(国内最常用)

(4)Mesos模式:Spark使用Mesos平台进行资源与任务的调度。(国内很少用)

Local模式

1. 上传Spark压缩包并解压

tar -zxf spark-3.3.1-bin-hadoop3.tgz -C /export/server/
mv spark-3.3.1-bin-hadoop3 spark-local
cd spark-local

2.  官方求PI案例

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master local[*] \
./examples/jars/spark-examples_2.12-3.3.1.jar \
10

Yarn模式

1. 上传Spark压缩包并解压

tar -zxf spark-3.3.1-bin-hadoop3.tgz -C /export/server/
mv spark-3.3.1-bin-hadoop3 spark-yarn
cd spark-yarn

2. 修改spark-env.sh配置文件

cd /export/server/spark-yarn/conf
mv spark-env.sh.template spark-env.sh
vim spark-env.sh
--添加如下内容
YARN_CONF_DIR=/export/server/hadoop/etc/hadoop

没有HDFS环境的可以参考:
本地部署HDFS集群https://blog.csdn.net/m0_73641796/article/details/145998092?spm=1001.2014.3001.5501

没有Yarn环境的可以参考:

本地YARN集群部署https://blog.csdn.net/m0_73641796/article/details/146051466?spm=1001.2014.3001.5501

3. 配置历史服务

cd /export/server/spark-yarn/conf
mv spark-defaults.conf.template spark-defaults.conf
su hadoop
hdfs dfs -mkdir /directory
su root
vim spark-defaults.conf
--添加如下内容:
spark.eventLog.enabled          true
spark.eventLog.dir              hdfs://node1:8020/directory
spark.yarn.historyServer.address=node1:18080
spark.history.ui.port=18080vim spark-env.sh
--添加如下内容:
export SPARK_HISTORY_OPTS="
-Dspark.history.ui.port=18080 
-Dspark.history.fs.logDirectory=hdfs://node1:8020/directory 
-Dspark.history.retainedApplications=30"

启动Spark历史服务

cd /export/server/spark-yarn
sbin/start-history-server.sh

4. 启动HDFS与YARN集群

su hadoop
start-dfs.sh
start-yarn.sh

5. 官方求PI案例

su hadoop
cd /export/server/spark-yarn
bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
./examples/jars/spark-examples_2.12-3.3.1.jar \
10


http://www.mrgr.cn/news/94721.html

相关文章:

  • 【AIGC】OpenAI 集成 Langchain 操作实战使用详解
  • Ubuntu从源码安装Webots
  • MySQL 8.4.X 企业版TDE加密功能 测试和验证
  • 手写一些常见算法
  • 使用Python在Word中生成多种不同类型的图表
  • SQL Server表数据变更捕获的5种方法及实战对比
  • Centos离线安装perl
  • 类和对象C++ (未完:对象特征)
  • RISC-V汇编学习(三)—— RV指令集
  • 第八节:红黑树(初阶)
  • 数据结构------线性表(顺序表)
  • 【极光 Orbit·STC8x】05. GPIO库函数驱动LED流动
  • 经历过的IDEA+Maven+JDK一些困惑
  • Python学习第十九天
  • 基于eNSP的IPV4和IPV6企业网络规划
  • 【NLP 38、实践 ⑩ NER 命名实体识别任务 Bert 实现】
  • llama-factory笔记
  • Flask使用Blueprint注册管理路由
  • 用Deepseek写一个 HTML 和 JavaScript 实现一个简单的飞机游戏
  • HarmonyOS NEXT开发实战——HUAWEI DevEco Studio 开发指南