基本环境配置
core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xmlworkers 配置历史服务器
配置历史服务器配置日志聚集启动历史服务器命令 常用端口号
基本环境配置 core-site.xmlhdfs-site.xmlfs.defaultFS hdfs://hadoop102:8020 hadoop.tmp.dir /opt/module/hadoop-3.1.3/data hadoop.http.staticuser.user xxyw
yarn-site.xmldfs.namenode.http-address hadoop102:9870 dfs.namenode.secondary.http-address hadoop104:9868
mapred-site.xmlyarn.nodemanager.aux-services mapreduce_shuffle yarn.resourcemanager.hostname hadoop103 yarn.nodemanager.env-whitelist JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME
workersmapreduce.framework.name yarn
设置分布式节点,在Hadoop2.X中文件名是slaves
hadoop102 hadoop103 hadoop104
设置3个节点的主机名即可。
配置历史服务器 配置历史服务器在mapred-site.xml中添加如下配置信息
配置日志聚集mapreduce.jobhistory.address hadoop102:10020 mapreduce.jobhistory.webapp.address hadoop102:19888
日志聚集是指应用运行完成以后,将程序运行日志信息上传到HDFS系统上。
日志聚集的好处是可以方便的查看到程序运行详情,方便开发调试。
在yarn-site.xml中添加如下配置信息
启动历史服务器命令yarn.log-aggregation-enable true yarn.log.server.url http://hadoop102:19888/jobhistory/logs yarn.log-aggregation.retain-seconds 604800
mapred --daemon start historyserver常用端口号
| 端口名称 | Hadoop2.X | Hadoop3.X |
|---|---|---|
| NameNode内部通信端口 | 8020 / 9000 | 8020 / 9000 / 9820 |
| NameNode用户访问端口 | 50070 | 9870 |
| 查看任务执行端口 | 8088 | 8088 |
| 历史服务器端口 | 19888 | 19888 |



