1、上传压缩包并解压
2、查看hadoop支持的压缩方式以及本地库
3、修改配置文件
(1)hadoop-env.sh
(2)core-site.xml
(3)hdfs-site.xml
(4)mapred-site.xml
(5)yarn-site.xml
4、配置hadoop的环境变量
5、格式化集群
6、启动集群
7、停止集群
本人是三台服务器一起启动,因此以下文章会出现第一第二,望读者自行区分。
建议每一个服务器都执行一遍,加深理解
1、上传压缩包并解压
将我们重新编译之后支持snappy压缩的hadoop包上传到第一台服务器并解压;
第一台机器执行以下命令
cd /kkb/soft/ tar -xzvf hadoop-3.1.4.tar.gz -C /kkb/install
2、查看hadoop支持的压缩方式以及本地库
bin/hadoop checknative
如果出现openssl为false,那么所有机器在线安装openssl即可,执行以下命令,虚拟机联网之后就可以在线进行安装了
sudo yum -y install openssl-devel
3、修改配置文件
(1)hadoop-env.sh
vim hadoop-env.sh
export JAVA_HOME=/qinluyu/install/jdk1.8.0_141
(2)core-site.xml
vim core-site.xml
fs.defaultFS hdfs://node01:8020 hadoop.tmp.dir /qinluyu/install/hadoop-3.1.4/hadoopDatas/tempDatas io.file.buffer.size 4096 fs.trash.interval 10080 hadoop.proxyuser.hadoop.hosts * hadoop.proxyuser.hadoop.groups * hadoop.http.staticuser.user hadoop
(3)hdfs-site.xml
vim hdfs-site.xml
dfs.namenode.secondary.http-address node01:9868 dfs.namenode.http-address node01:9870 dfs.namenode.name.dir file:///qinluyu/install/hadoop-3.1.4/hadoopDatas/namenodeDatas dfs.datanode.data.dir file:///qinluyu/install/hadoop-3.1.4/hadoopDatas/datanodeDatas dfs.namenode.edits.dir file:///qinluyu/install/hadoop-3.1.4/hadoopDatas/dfs/nn/edits dfs.namenode.checkpoint.dir file:///qinluyu/install/hadoop-3.1.4/hadoopDatas/dfs/snn/name dfs.namenode.checkpoint.edits.dir file:///qinluyu/install/hadoop-3.1.4/hadoopDatas/dfs/nn/snn/edits dfs.replication 3 dfs.permissions.enabled false dfs.blocksize 134217728
(4)mapred-site.xml
vim mapred-site.xml
mapreduce.framework.name yarn mapreduce.job.ubertask.enable true mapreduce.jobhistory.address node01:10020 mapreduce.jobhistory.webapp.address node01:19888 yarn.app.mapreduce.am.env HADOOP_MAPRED_HOME=${HADOOP_HOME} mapreduce.map.env HADOOP_MAPRED_HOME=${HADOOP_HOME} mapreduce.reduce.env HADOOP_MAPRED_HOME=${HADOOP_HOME}
(5)yarn-site.xml
vim yarn-site.xml
yarn.resourcemanager.hostname node01 yarn.nodemanager.aux-services mapreduce_shuffle yarn.nodemanager.env-whitelist JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME yarn.scheduler.minimum-allocation-mb 512 yarn.scheduler.maximum-allocation-mb 4096 yarn.nodemanager.resource.memory-mb 4096 yarn.nodemanager.pmem-check-enabled false yarn.nodemanager.vmem-check-enabled false yarn.log-aggregation-enable true yarn.log.server.url http://node01:19888/jobhistory/logs yarn.log-aggregation.retain-seconds 25920000
4、配置hadoop的环境变量
sudo vim /etc/profile
export HADOOP_HOME=/qinluyu/install/hadoop-3.1.4 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source /etc/profile
5、格式化集群
要启动 Hadoop 集群,需要启动 HDFS 和 YARN 两个集群。
注意:首次启动HDFS时,必须对其进行格式化操作。本质上是一些清理和准备工作,因为此时的 HDFS 在物理上还是不存在的。
hdfs namenode -format
6、启动集群
start-dfs.sh start-yarn.sh # 已过时mr-jobhistory-daemon.sh start historyserver mapred --daemon start historyserver
7、停止集群
stop-dfs.sh stop-yarn.sh # 已过时 mr-jobhistory-daemon.sh stop historyserver mapred --daemon stop historyserver



