栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop之YARN介绍

Hadoop之YARN介绍

yarn:资源调度和任务管理
a、四大组件:(四个进程)
ResourceManager(Rm):主进程
Nodemanager(NM):各个机器节点管理器
ApplicationMaster(AM):申请资源
Container容器:处理各个节点分布式作业的

YARN架构介绍:

 YARN执行流程:

 1、client连接RM提交作业,RM给client一个JobId(ApplicationManager和ResourceScheduler)
2、RM中的ApplicationManager连接一个NM,让NM创建一个AM处理客户端作业请求
3、AM连接RM中的ApplicationManager申请Nodemanager,
4、AM连接ResourceScheduler去给client的作业申请资源(cpu、内存、磁盘、网络)
5、AM连接NM,发送client job作业程序和申请的资源cpu、内存、磁盘、网络
6、NM启动Container进程运行job的不同任务
7、Container进程运行状态实时反馈给AM
8、AM反馈任务状态信息给RM中的ApplicationManager

9、client端可以连接RM或AM查询job的执行情况

注:NM启动后去RM上进行注册,会不断发送心跳,说明存活状态

四大组件的作用:

ResourceManager:
1、处理客户端请求
2、启动/监控ApplicationMaster
3、监控NodeManager
4、资源分配与调度

APPlicationMaster:
1、程序切分
2、为应用程序申请资源,并分配任务
3、任务监控与容错

NodeManager:
1、单个节点上资源管理
2、处理来自ResourceManager的命令
3、处理来自ApplicationMaster的命令

Container:

对任务运行环境的抽象,封装了CPU、内存等多维资源以及环境变量、启动命令等任务运行相关信息’

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/761807.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号