栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop之HBase架构原理及集群部署总览

Hadoop之HBase架构原理及集群部署总览

一、概要

Hbase 是基于GoogleBigTable模型开发的,是一个构建在HDFS上的分布式列存储系统,是一个典型的key/value开源数据库;主要用于海量结构化数据存储;与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。从逻辑上讲,Hbase将数据按照表、行和列进行存储。适用于需要实时读写、随机访问超大规模数据集的场景中。

Hbase( Hadoop Database)是Apache的Hadoop项目的子项目,具备高可靠性、高性能、面向列、可伸缩、分布式特性,利用Hbase技术可在廉价PC Server上搭建起大规模结构化存储集群。Hbase不同于一般的关系数据库,它是一个适合于非结构化数据和半结构化的松散数据(列存NoSQL数据库)存储的数据库。Hbase上的数据是以StoreFile(HFile)二进制流的形式存储在HDFS上block块儿中。但是HDFS并不知道的hbase存的是什么,它只把存储文件是为二进制文件,也就是说,hbase的存储数据对于HDFS文件系统是透明的。HDFS不支持随机修改,查询效率低,对小文件支持不友好。

另外,Hbase基于列的而不是基于行的模式。Hbase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,Hbase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Big

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/747031.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号