栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

2021-10-26

2021-10-26

hadoop 特点
扩容能力
能可靠(reliably)地存储和处理PB级别的数据。如果数据量更大,存储不下了,再增加节点就可以了。

成本低
可以通过普通机器组成的服务器集群来分发以及处理数据.这些服务器集群可达数千个节点。

高效率
通过分发计算程序,hadoop可以在数据所在节点上(本地)并行地(parallel)处理他们,这使得处理非常的迅速

可靠性
hadoop能够自动地维护数据的多份副本,并且在任务失败后能够自动地重新部署(redeploy)计算任务.

hadoop 是一个适合海量数据的分布式存储和分布式计算的平台。
三大组件
hdfs:是一个分布式存储框架,适合海量数据存储
MapReduce:是一个分布式计算框架,适合海量数据计算
yarn:是一个资源调度平台,负责各计算框架分配计算资源

Hadoop 版本介绍
目前,hadoop 已经演变成为大数据计算的代名词,形成了一套完善的大数据计算的生态系统,所以针对hadoop也出现了很多版本

Http://hadoop.apache.org/releases.html
Apache hadoop
Cloudera hadoop (CDH)
使用下载最多的版本,稳定,有商业支持(收费),在Apache的基础上打上了一些patch
HortonWorks(HDP)
基于Apache的版本进行了集成,结合Ambari可以实现平台化快速安装部署。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/355182.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号