实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

MapReduce和Yarn技术原理

大数据系统更新时间：2026-06-04 11:09:55 发布时间：1621天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

概述

MapReduce基于分而治之的思想，用于大规模数据集(大于1TB)的并行计算和离线计算，特点如下：

高度抽象的编程思想：程序员仅需描述做什么，具体怎么做由系统的执行框架处理
良好的扩展性：可以通过添加节点以扩展集群的能力
高容错性：通过计算迁移或数据迁移等策略提高集群的可用性与容错性

Yarn它是一种新的Hadoop资源管理器，他是一个通用资源管理系统，可以为上层应用提供一的资源管理和调度，它的引入为集群在利用率、资源统一管理和共享等方面带来了巨大的好处。

一、MapReduce

1.1、MapReduce过程

Map面对杂乱无章的互不相干的数据，解析他的每个数据，从里面提取可以key和value，也就是提取了数据的特征
到了Reduce阶段，数据是以key后面跟着若干个value来组织的，这些value有相关性。在此基础上我们可以做进一步的处理以便得到结果

1.2Map、Reduce过程详细

1.3shuffer过程详细

二、Year

2.1、Year的组件架构

2.2、MapReduce在Yarn的任务调度流程

三、Year的资源管理和任务调动

3.1、资源管理
每个NodeManager可分配的内存和cpu的数量可以通过配置选项设置(可以在Yarn服务配置或者页面配置)
3.2、三种资源调度器

FIFO Scheduler(先进先去)：
Capacity Scheduler(容量调度器)：容量调度器的队列里面采用的是FIFO策略
Fair Scheduler(公平调度器):保证每一个任务分配的资源是公平的
3.3容量调度器的特点
容量保证:可以设置队列的最低资源和资源使用的上限
灵活性：如果一个队列中的资源有剩余，可以暂时共享给那些需要资源的队列
支持优先级：支持任务优先级调度(默认FIFO策略)
多重租赁：支持多个用户共享集群和多应用程序同时运行
动态更新配置文件：可以更具需要动态修改配置参数。
3.4容量调度器的任务选择

3.5、查看队列的信息
队列的信息可以通过Yarn 、webUI 进行查看

四、增强特性

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/676610.html

上一篇一分钟快速配置hystrix断路器、及hystrix dashboard 断路器仪表盘

下一篇云计算安装kvm

大数据系统相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号