栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

spark配置Yarn模式(混合部署模式)

spark配置Yarn模式(混合部署模式)

系列文章:
第一章 Hadoop集群搭建的准备
第二章 Hadoop集群搭建
第三章 Zookeeper分布式集群部署(2n+1台虚拟机)
第四章 Hadoop高可用集群搭建(HA)
待更新
第九章 spark独立模式部署(Standalone)
第十章 spark配置历史服务
第十一章 搭建Spark高可用(HA)
第十二章 spark配置Yarn模式(混合部署模式)
待更新


文章目录

Spark设置Yarn模式

1.停止集群。2.修改Hadoop的配置文件。3.修改spark-env.sh文件。4.启动HDFS和YARN集群。5.启动集群。6.提交应用测试。7、配置历史服务。


Spark设置Yarn模式

 前提:进入spark目录(这里是/export/servers/spark-3.1.2)

1.停止集群。
sbin/stop-all.sh
2.修改Hadoop的配置文件。

 进入Hadoop的etc/hadoop/目录(这里是/export/servers/hadoop-2.7.4/etc/hadoop)。
 在标签之间添加以下内容:

	
	
		yarn.resourcemanager.pmem-check-enabled
		false
	
	
	
		yarn.resourcemanager.vmem-check-enabled
		false
	
3.修改spark-env.sh文件。

 修改配置文件(先进入spark-3.1.2的conf目录)

cd /export/servers/spark-3.1.2/conf
vim spark-env.sh

 添加JAVA_HOME和YARN_CONF_DIR配置:

export JAVA_HOME=/export/servers/jdk1.8.0
YARN_CONF_DIR=/export/servers/hadoop-2.7.4/etc/hadoop
4.启动HDFS和YARN集群。
start-all.sh
5.启动集群。
sbin/start-all.sh
6.提交应用测试。

 进入/export/servers/spark-3.1.2目录

sbin/start-all.sh

 命令行输入:

bin/spark-submit 
--class org.apache.spark.examples.SparkPi 
--master yarn 
--deploy-mode cluster 
./examples/jars/spark-examples_2.12-3.1.2.jar 
10

--deploy-mode 指定部署模式,cluster表示集群模式(控制台看不到结果),client表示客户端模式(控制台可以看到结果)。 7、配置历史服务。

 步骤与 第十章 spark配置历史服务相同,只是在spark-defaults.conf文件中多添加两行配置。
 修改spark-defaults.conf文件。

mv spark-defaults.conf.template spark-defaults.conf
vim spark-defaults.conf

 添加以下内容,配置日志存储路径:

spark.eventLog.enabled	true
spark.eventLog.dir	hdfs://node1:9000/directory
#以下是多出来的两行配置
spark.yarn.historyServer.address=node1:180180
spark.history.ui.port=18080
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/746473.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号