栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Spark Standalone HA 模式安装及问题处理

Spark Standalone HA 模式安装及问题处理

 前提:确保Zookeeper和HDFS均已经启动

node1启动HADOOP(任意路径输入以下命令)

(base) [root@node1 server]# start-all.sh 
 三台主机都启动zookeeper(三台主机都需要执行)
 (base) [root@node1 server]# cd /export/server/apache-zookeeper-3.5.6-bin
 (base) [root@node1 apache-zookeeper-3.5.6-bin]# bin/zkServer.sh start

1、配置文件修改

跳转到配置文件夹:

[root@node1 zookeeper-3.4.9]# cd /export/server/spark/conf

[root@node1 conf]# vim spark-env.sh

注释或删除掉下面的语句(前面加#号)

#export SPARK_MASTER_HOST=node1

增加以下内容:
SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=node1:2181,node2:2181,node3:2181 -Dspark.deploy.zookeeper.dir=/spark-ha"
# spark.deploy.recoveryMode 指定HA模式 基于Zookeeper实现
# 指定Zookeeper的连接地址
# 指定在Zookeeper中注册临时节点的路径

2、将spark-env.sh 分发到每一台服务器上

[root@node1 conf]# scp spark-env.sh node2:/export/server/spark/conf/
[root@node1 conf]# scp spark-env.sh node3:/export/server/spark/conf/

3、停止当前StandAlone集群

[root@node1 spark]# cd /export/server/spark

[root@node1 spark]# sbin/stop-all.sh

4、启动集群 

# 在node1上 启动一个master 和全部worker
[root@node1 spark]# sbin/start-all.sh

# 注意, 下面命令在node2上执行,需要上面的启动后再执行这个
[root@node2 spark]# sbin/start-master.sh
# 在node2上启动一个备用的master进程

#启动后node1和node2都会有master和worker进程(node1为主,node2为备)

5、查看主备情况

 http://node1:8081/

 #注:8080端口没被占用的情况下,页面查看用http://node1:8080/

#需用哪个端口可以通过以下命令查看

(base) [root@node1 spark]# jps

 (base) [root@node1 spark]# netstat -anp | grep 27552

问题处理 

如果显示node1和node2启动后都是

Status: STANDBY

可以安装更新版的zookeeper解决,安装方法同以下链接

Linux中安装Zookeeper_沉默鹰_90的博客-CSDN博客

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/775650.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号