实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop简介及Hadoop 2.x.x核心组件小摘

大数据系统更新时间：2026-05-21 12:06:39 发布时间：1629天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

可以这样说，hadoop集群的诞生是应时代的产物，适用于处理大规模数据。Hadoop的诞生源于谷歌公司的三篇经典论文：

《The Google File System,SOSP》介绍了谷歌公司研发的面向大规模数据密集型应用的分布式文件系统.
《Operating System Design and Implementation,OSDI》中介绍一种可以在通用机群上进行分布式部署的大数据处理框架，即MapReduce.
《Bigtable:A Distributed Storage System for Structured Data》则介绍了一种处理海量数据的分布式NoSQL数据库框架.

随后Apache软件基金会发起了Apache Hadoop.在早期，Hadoop包含三个子项目：

HDFS:Hadoop Distributed File System,即Hadoop分布式文件系统，是底层也是基础。对应上述《SOSP》的思想.
MapReduce:分布式计算框架,可以将其理解为"Hadoop集群这间屋子的框架",对应上述《OSDI》中的思想.
Hbase:NoSQL数据库.目前比较发展比较强大,甚至可以与除HDFS外的其它组件并重.

以下是Hadoop 2.x.x 版本的核心组件及重要的外部扩展：

各组件的作用：

HDFS：实现大数据文件的存储以及用于管理存储集群.但不支持数据的表格化管理以及快速检索.
Hbase:在HDFS基础之上，将数据组织为面向列的数据表,可以进行快速查找，不对数据进行分布式处理，所以依赖于HDFS.
Yarn:负责集群内存、CPU资源的管理，同时对分布式任务进行资源分配和管理。被看作是一个统一的集群资源与任务管理组件.
MapReduce：通过向Yarn申请资源,提交任务，自定义方法实现对数据的处理。
Hive:实现了NoSQL于传统SQL的交互，实现了NoSQL对传统SQL的兼容，体现了计算机科学里面的"上对下兼容特性"。

我是绝云椒椒,大数据科班在读生。希望和你一起共同进步！我的下一篇文章，将为你介绍HDFS以及Yarn的介绍与配置！

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/630460.html

上一篇 Mybatis解决属性名和字段不一致的问题

下一篇【计算机·科技】互联网的黑科技来啦

大数据系统相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号