栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop3.3.1详细教程(五)Hadoop全分布式搭建

Hadoop3.3.1详细教程(五)Hadoop全分布式搭建

一、haoop解压、创建软连接
将hadoop-3.3.1.tar.gz上传到服务器~/apps下
tar -xf hadoop-3.3.1.tar.gz -C /usr/local
进入/usr/local 后使用 ln -s hadoop-3.3.1 hadoop3 创建一个软连接

二、配置环境变量
在/etc/profile.d下使用vi命令新建hadoop.sh

export  HADOOP_HOME=/usr/local/hadoop3
export  PATH=$PATH:$HADOOP_HOME/bin
export  PATH=$PATH:$HADOOP_HOME/sbin

以上可复制到vi编辑器中:

保存,调用 source hadoop.sh
测试版本号 hadoop version

三、配置hadoop环境脚本中的java参数
在hadoop2/etc/hadoop下的
[root@hadoop01 hadoop]# vim hadoop-env.sh

在文件最后添加上

export JAVA_HOME=$JAVA_HOME
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

四、创建Hadoop存储目录,在/目录下新建三个文件

[root@hp1 /]# mkdir -p  hadoop_data/tmp
[root@hp1 /]# mkdir -p  hadoop_data/dfs/name
[root@hp1 /]# mkdir    hadoop_data/dfs/data

五、配置主从结点
删除hadoop2/etc/hadoop/slaves中配置,将hp1、hp2、hp3添加到workers文件中作为集群的slaves(一行一个)

六、Hadoop文件配置
配置core-site.xml



fs.defaultFS
hdfs://hp1:9000


io.file.buffer.size
131072


hadoop.tmp.dir
file:/hadoop_data/tmp


配置改hdfs-site.xml



dfs.namenode.secondary.http-address
hp1:9001


dfs.namenode.name.dir
file:/hadoop_data/dfs/name


dfs.datanode.data.dir
file:/hadoop_data/dfs/data


dfs.replication
2


dfs.webhdfs.enabled
true


yarn-site.xml:




yarn.nodemanager.aux-services
mapreduce_shuffle




yarn.resourcemanager.hostname
hp301



yarn.nodemanager.env-whitelist

JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CO NF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME



yarn.log-aggregation-enable
true



yarn.log.server.url
http://hp301:19888/jobhistory/logs



yarn.log-aggregation.retain-seconds
604800


mapred-site-xml:
复制文件:
cp mapred-site.xml.template mapred-site.xml


	mapreduce.framework.name
	yarn


	mapreduce.jobhistory.address
	hp1:10020


	mapreduce.jobhistory.webapp.address
	hp1:19888


七、分发hp1的配置到hp2、hp3:

将hadoop远程复制到hp2 hp3上

[root@hp1 /]# scp -r /usr/local/hadoop-2.8.5/  hp2:/usr/local
[root@hp1 /]# scp -r /usr/local/hadoop-2.8.5/  hp3:/usr/local

然后分别在hp2、hp3建一个软连接。 ln -s hadoop-2.8.5 hadoop2

将hadoop 环境变量远程复制到hp2 hp3上

[root@hp1 /]# scp -r /etc/profile.d/hadoop.sh  hp2:/etc/profile.d
[root@hp1 /]#scp -r /etc/profile.d/hadoop.sh  hp3:/etc/profile.d

并在hp2、hp3中分别调用source hadoop.sh

将文件夹分发:

[root@hp1 /]# scp -r hadoop_data/  hp2:/
[root@hp1 /]# scp -r hadoop_data/  hp3:/

测试版本号 hadoop version

八、格式化主节点的存储目录
只对hp1的hadoop_data格式化。
第一次启动hadoop是需要格式化hadoop的namenode
命令:

hdfs namenode -format

九、启动hadooop
启动dfs
命令:start-dfs.sh
启动yarn
命令:start-yarn.sh

通过jps命令,可以查看hadoop启动的进程
在hp01结点上,正常应该包含
NameNode
SecondaryNameNode
ResourceManager

在hp02和hp03结点上,正常应该包含
DataNode
NodeManager

NameNode没有启动的解决方案

首先,打开hp01结点上的/usr/local/hadoop2下的logs文件夹中hadoop-namenode.hp01.log文件。
查看有什么Java异常信息。根据异常信息进行错误的解决。

如果异常仅仅显示IOExcepiton:NameNode is not formatted

则需要将hp01、hp02、hp03三个节点的/hadoop_data文件夹删除,然后重启三个节点,分别创建这一组目录,然后重新对hp01进行格式化。

关闭yarn
命令:stop-yarn.sh
关闭dsf
命令:stop-dfs.sh
关闭yarn
命令:stop-yarn.sh
关闭dsf
命令:stop-dfs.sh

十、测试hadoop安装
在web页面中查看hdfs和yarn
http://192.168.150.101:9870
http://192.168.150.101:8088

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/423465.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号