栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

hadoop-yarn

hadoop-yarn

Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。

Yarn基本架构

YARN主要由ResourceManager、NodeManager、ApplicationMaster和Container等组件构成。

目前,Hadoop作业调度器主要有三种:FIFO、Capacity Scheduler容量调度器和Fair Scheduler公平调度器。

yarn资源调度器

1)Hadoop调度器重要分为三类:

        FIFO 、Capacity Scheduler(容量调度器)和Fair Sceduler(公平调度器)。

        Apache默认的资源调度器是容量调度器;

        CDH默认的资源调度器是公平调度器。

2)区别:

        FIFO调度器:支持单队列 、先进先出   生产环境不会用。

                按照到达时间,先到先服务

        容量调度器:支持多队列,保证先进入的任务优先执行。

                支持多个队列,每个队列可配置一定的资源,每个队列采用FIFO调度策略

                为了防止同一个用户独占资源,该调度器会对统一用户所提交的资源量进行限定

                首先,计算每个队列中正在运行的任务数与其分得的计算资源的比值,选择该比值最小的队列-最闲的

                其次,按照作业优先级和提交顺序,同时考虑用户资源量限制和内存限制对队列内任务排序。

                队列中按照任务的先后顺序依次执行

        公平调度器:支持多队列,保证每个任务公平享有队列资源。

                支持多队列多用户,每个队列中的资源量可以配置,同一队列中的作业共享队列中的所有资源

                每个队列中job都会按照优先级分配资源,优先级越高,资源分配越多,但是每个job都会分配到资源

                在资源有限的情况下,理想情况下获得的资源与实际获得的资源会有一种差距,这个差距就叫做缺额

                同一队列中,job资源缺额越大,越先获得资源优先执行。作业按照缺额的高低来先后执行。

Yarn工作机制

        作业提交全过程详解

        (1)作业提交

                第1步:Client调用job.waitForCompletion方法,向整个集群提交MapReduce作业。

                第2步:Client向RM申请一个作业id。

                第3步:RM给Client返回该job资源的提交路径和作业id。

                第4步:Client提交jar包、切片信息和配置文件到指定的资源提交路径。

                第5步:Client提交完资源后,向RM申请运行MrAppMaster。

        (2)作业初始化

                第6步:当RM收到Client的请求后,将该job添加到容量调度器中。

                第7步:某一个空闲的NM领取到该Job。

                第8步:该NM创建Container,并产生MRAppmaster。

                第9步:下载Client提交的资源到本地。

        (3)任务分配

                第10步:MrAppMaster向RM申请运行多个MapTask任务资源。

                第11步:RM将运行MapTask任务分配给另外两个NodeManager,另两个NodeManager分别领取任务并创建容器。

        (4)任务运行

                第12步:MR向两个接收到任务的NodeManager发送程序启动脚本,这两个NodeManager分别启动MapTask,MapTask对数据分区排序。

                第13步:MrAppMaster等待所有MapTask运行完毕后,向RM申请容器,运行ReduceTask。

                第14步:ReduceTask向MapTask获取相应分区的数据。

                第15步:程序运行完毕后,MR会向RM申请注销自己。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/784495.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号