栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 系统运维 > 运维 > Linux

Spark 2.7.7 完全分布式部署

Linux 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Spark 2.7.7 完全分布式部署

组件版本
组件版本下载地址
Hadoop2.7.7hadoop 2.7.7
JDK1.8jdk 8
Mysql5.7Mysql 5.7
Hive2.3.4Hive 2.3.4
Spark2.1.1Spark 2.1.1
**机器环境 **
IP主机名密码
192.168.222.201masterpassword
192.168.222.202slave1password
192.169.222.203slave2password
1、机器基础环境

参考地址:https://blog.csdn.net/su_mingyang/article/details/118070573

  1. 关闭防火墙,设置开机不自启(三台虚拟机都要做该操作)
  2. 配置hosts文件(三天能够互相通信)
  3. 配置SSH
  4. 时间同步配置NTP或使用date手动调整
2、安装java(三台机器都要安装)

参考地址:https://blog.csdn.net/su_mingyang/article/details/120872313

3、安装hadoop 2.7.7 完全分布式

参考地址:https://blog.csdn.net/su_mingyang/article/details/120872850

4、搭建Spark 完全分布式 4.1 、解压spark文件

[root@master ~]#

tar -xzvf /chinaskills/spark-2.1.1-bin-hadoop2.7.tgz -C /usr/local/src/
4.2、重命名

[root@master ~]#

mv /usr/local/src/spark-2.1.1-bin-hadoop2.7 /usr/local/src/spark
4.3、配置spark 环境变量

[root@master ~]#

vi /root/.bash_profile

配置内容:

export SPARK_HOME=/usr/local/src/spark
export PATH=$PATH:$SPARK_HOME/sbin:$SPARK_HOME/bin
4.4 加载环境变量
source /root/.bash_profile
4.5 配置spark

[root@master ~]#

cp /usr/local/src/spark/conf/spark-env.sh.template /usr/local/src/spark/conf/spark-env.sh
vi /usr/local/src/spark/conf/spark-env.sh

配置内容:

# java位置
export JAVA_HOME=/usr/local/src/java
# master节点IP或域名
export SPARK_MASTER_IP=master
# worker内存大小
export SPARK_WORKER_MEMORY=1G
# Worker的cpu核数
SPARK_WORKER_CORES=1
# hadoop配置文件路径
export HADOOP_CONF_DIR=/usr/local/src/hadoop/etc/hadoop
4.6 配置slaves

[root@master ~]#

cp  /usr/local/src/spark/conf/slaves.template /usr/local/src/spark/conf/slaves
vi /usr/local/src/spark/conf/slaves.template

配置内容:

master
slave1
slave2
4.7 分发文件给slave1和slave2
scp -r /usr/local/src/spark slave1:/usr/local/src/
scp -r /usr/local/src/spark slave2:/usr/local/src/
scp /root/.bash_profile slave1:/root/
scp /root/.bash_profile slave2:/root/
4.8 启动Spark 集群
/usr/local/src/spark/sbin/start-all.sh

输出信息:

starting org.apache.spark.deploy.master.Master, logging to /usr/local/src/spark/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.out
slave2: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/src/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave2.out
slave1: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/src/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave1.out
master: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/src/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-master.out
4.9 web访问

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iEDbSa7G-1634734160666)(image-20211020204026393.png)]

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/338949.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号