前言一、core-site.xml二、hdfs-site.xml三、yarn-site.xml四、mapred-site.xml
前言
简单整理一下Hadoop下conf目录下core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml这四个配置文件的配置说明,用作学习。
官方文档
一、core-site.xml
- 指定NameNode的地址
hadoop3.x默认端口为8020
指定hadoop数据的存储目录fs.defaultFS hdfs://hadoop102:8020
配置HDFS网页登录使用的静态用户为yshadoop.tmp.dir /opt/module/hadoop-3.1.3/data
hadoop.http.staticuser.user ys
二、hdfs-site.xml
- NameNode web端访问地址
ScondNameNode web端访问地址dfs.namenode.http-address hadoop102:9870
指定HDFS副本的数量,默认3,最大副本数默认512dfs.namenode.http-address hadoop102:9870
dfs.replication 3
三、yarn-site.xml
- 指定MR走shuffle过程
指定ResourceManager的地址yarn.nodemanager.aux-services mapreduce_shuffle
环境变量的继承yarn.resourcemanager.hostname hadoop103
yarn容器分配的最大最小内存(默认1024和8192)yarn.nodemanager.env-whitelist JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME
yarn容器允许管理的物理内存大小(默认8192MB)yarn.scheduler.minimum-allocation-mb 512 yarn.scheduler.maximum-allocation-mb 4096
关闭yarn对虚拟内存的限制检查yarn.nodemanager.resource.memory-mb 4096
开启日志聚集功能yarn.nodemanager.vmem-check-enabled false
设置日志聚集服务器地址yarn.log-aggregation-enable true
设置日志保留时间(7天)yarn.log.server.url http://hadoop102:19888/jobhistory/logs
yarn.log-aggregation.retain-seconds 604800
四、mapred-site.xml
- 指定MapReduce程序运行在Yarn上
历史服务器端地址mapreduce.framework.name yarn
历史服务器web端地址mapreduce.jobhistory.address hadoop102:10020
mapreduce.jobhistory.webapp.address hadoop102:19888
持续更新中...
以上就是今天要讲的内容,本文仅仅简单介绍了Hadoop的四个核心配置使用,后续遇到还会更新和说明相关配置。



