栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 其他 > Hadoop

详解Hadoop 2.0中的CDH4 MR配置

Hadoop 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

MR1

cdh不建议使用MRv2.0作为生产环境,故依旧提供了mr1的包

mr1-2.0.0-mr1-cdh4.1.2.tar.gz

解压后copy至原hadoop路径,有如下文件冲突:

  1. [root@h011171 ~]# cp -r hadoop-2.0.0-cdh4.1.2/* /usr/local/hadoop/ cp: overwrite `/usr/local/hadoop/bin/rcc’? y 
  2. cp: overwrite `/usr/local/hadoop/bin/hadoop’? y cp: overwrite `/usr/local/hadoop/cloudera/cdh_version.properties’? y 
  3. cp: overwrite `/usr/local/hadoop/cloudera/apply-patches’? y cp: overwrite `/usr/local/hadoop/cloudera/build.properties’? y 
  4. cp: overwrite `/usr/local/hadoop/cloudera/CHANGES.cloudera.txt’? y 

均覆盖即可

基本兼容cdh3 mr1的所有mapreduce配置,包括公平调度器/hadoop acl权限设置,

使用

  1. ./bin/start-mapred.sh ./bin/stop-mapred.sh 

监控调度界面同原CDH3

MR2(YARN)

MRv2最基本的设计思想是将JobTracker的两个主要功能,即资源管理和作业调度/监控分成两个独立的进程。在该解决方案中包含两个组件:全局的ResourceManager(RM)和与每个应用相关的ApplicationMaster(AM)。这里的“应用”指一个单独的MapReduce作业或者DAG作业。RM和与NodeManager(NM,每个节点一个)共同组成整个数据计算框架。RM是系统中将资源分配给各个应用的最终决策者。AM实际上是一个具体的框架库,它的任务是【与RM协商获取应用所需资源】和【与NM合作,以完成执行和监控task的任务】。

架构描述如下:





配置

mapred-site.xml配置

 

  1.     
  2. mapreduce.framework.name yarn 
  3.   
  4. mapreduce.jobhistory.address h011200.hebe.grid.sina.com.cn:10020 
  5.   
  6. mapreduce.jobhistory.webapp.address h011200.hebe.grid.sina.com.cn:19888 
  7.  

yarn-site.xml配置

 

  1.  yarn.resourcemanager.resource-tracker.address 
  2. h011200.hebe.grid.sina.com.cn:8031  
  3.  yarn.resourcemanager.address                # RMtracker地址意同jobtrakcer 
  4. h011200.hebe.grid.sina.com.cn:8032  
  5.  yarn.resourcemanager.scheduler.address     # RMscheduler地址意同mv1的jobscheduler 
  6. h011200.hebe.grid.sina.com.cn:8030  
  7.  yarn.resourcemanager.admin.address 
  8. h011200.hebe.grid.sina.com.cn:8033  
  9.  yarn.resourcemanager.webapp.address  #RM Web地址同mr1 默认的50030 
  10. h011200.hebe.grid.sina.com.cn:8088  
  11.     
  12.  Classpath for typical applications. 
  13. yarn.application.classpath  
  14. $HADOOP_CONF_DIR, $HADOOP_COMMON_HOME/*,$HADOOP_COMMON_HOME/lib/*, 
  15. $HADOOP_HDFS_HOME/*,$HADOOP_HDFS_HOME/lib/*, $HADOOP_MAPRED_HOME/*,$HADOOP_MAPRED_HOME/lib/*, 
  16. $YARN_HOME/*,$YARN_HOME/lib/*  
  17.   
  18. yarn.nodemanager.aux-services mapreduce.shuffle 
  19.   
  20. yarn.nodemanager.aux-services.mapreduce.shuffle.class org.apache.hadoop.mapred.ShuffleHandler 
  21.   
  22. yarn.nodemanager.local-dirs /data1/hadoop/data/yarn/local 
  23.   
  24. yarn.nodemanager.log-dirs /data1/hadoop/data/yarn/log 
  25.   
  26. Where to aggregate logs yarn.nodemanager.remote-app-log-dir 
  27. /var/log/hadoop-yarn/apps  
  28.     
  29. yarn.app.mapreduce.am.staging-dir /user 
  30.  
启动

 

./sbin/start-yarn.sh

会启动本地RM及远程NM

./sbin/mr-jobhistory-daemon.sh start historyserver

启动本地historyserver

RM界面



Job history界面



原文链接:http://minidb.sinaapp.com/?p=138

【编辑推荐】

  1. 基于Hadoop云盘系统1:上传和下载效率优化
  2. 基于Hadoop云盘系统2:HDFS文件访问控制
  3. 分布式文件系统HDFS设计
  4. 分布式文件系统HDFS中Block介绍
  5. Hadoop 2.0.3在Linux环境下单机部署
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/796405.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号