栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

HBase介绍

HBase介绍

目录

Hbase简介

            相关背景

             CAP理论

              NoSQL



Hbase简介

Hbase是Apache旗下的一款高可靠性,高性能,面向性,可伸缩的分布式数据库,利用了Hbase技术可以在廉价的PC服务器上搭建大规模的存储化集群,使用Hbase可以对数十亿级别的大数据进行实时性的高性能读写,在满足高性能 的同时还保证了数据存取的原子性。

相关背景

随着数据规模越来越大,大量业务场景开始考虑数据存储的水平扩展,使得存储服务可以快速执行客户端发来的请求,而目前的关系型数据库更专注一台机器。海量数据量存储成为提升应用性能的瓶颈,单台机器无法负载海量的数据处理,随之而来的出现了很多的分布式存储解决方案,Hbase就是其中之一。

Hbase--Database on Hadoop,基于分布式文件系统上面建立的数据库,Hbase是面向列的开源数据库。开源团队根据2008年Google发布了一篇关于Google搜索引擎BigTable的核心思想的论文,实现了基于分布式文件系统的列数据库。随后加入Apache基金会,成为Hadoop生态圈中的顶级项目被大家熟知。

CAP理论

有的专家尝试将关系型数据库做成分布式数据库,把压力分摊到多个服务器上,但是,随之而来的问题则是很难保证原子性。增加一些操作可以保证原子性,但是性能又大幅度下降了。专家们始终没有办法构建一个即有完美原子性又兼高性能的分布式数据库。就在一筹莫展的时候有人想起。20世纪90年代初的Berkerly大学Eric Brewer 教授提出了CAP理论。CAP理论全称是  Consistency Availability and Partition tolerance

一致性(Consistency ):更新操作成功后,所有节点在同一时间的数据完全一致。

可用性(Availability ):用户访问数据时,系统是否能在正常响应时间返回结果。即良好的响应功能

分区容错性(Partition tolerance):分布式系统在遇到某节点或网络分区故障的时候,仍然能够对外提供满足一致性和可用性的服务。即可靠性

Brewer教授给出的定理是:任何分布式系统只可能同时满足二点,没法三者兼顾

NoSQL

对于CAP割行的放弃带来了全新的数据库——非关系型数据库{NoSQL, Not only SQL)。

有些数据库关注一致性和可用性(CA),对分区容错性不感冒。例如:Vertica,Aster Data和Greenplum等,有些数据库关注一致性和分区容错性(CP),对可用性不感冒。例如:Big Table,MongoDB和Hbase等。有些关注可用性和分区容错性(AP),对一致性不感冒。例如:Dynamo,KAl和Cassandra等。总之,数据库的世界此次开始百花齐放起来了,如下图:

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/673483.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号