(1)Hbase的定义
Hbase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。
(2)Hbase数据模型
逻辑上,Hbase的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列。但是从Hbase的底层物理存储结构来看,Hbase更像是一个multi-dimensional map(多维地图/多维映射)。
(3)数据模型
1)Hbase的数据模型由namespace、table等组成…
namespace:
命名空间,类似于关系型数据库中database的概念。每个命名空间下有多个表。Hbase自带俩个命名空间,分别是hbase和default。hbase中存放的是Hbase内置的表,default表是用户默认使用的命名空间。如果用户直接创建表,则该表存储与default中。
2)Table:
类似于关系数据库中table的概念,与之不同的是,Hbase定义表时只需声明列族即可,不需要声明具体的列。和关系型数据库相比,Hbase能够轻松应对字段变更的场景。
3)Row:
Hbase表中的每行数据都由一个RowKey和多个Column组成,数据是按照RowKey的字典顺序存储的,并且查询数据只能通过RowKey进行检索。
4)Column:
Hbase中每个列都有ColumnFamily(列族)和ColumnQualifier(列限定符)进行限定,例如:msg:name,info:gender。建表时,只需指明列族,而限定列符无需提前定义。
5)timeStamp
用户标识数据的不同版本(version),每条数据写入时,系统会自动为其加上该字段,其值为Hbase写入的时间。
6)Cell
由{rowkey, column Family:column Qualifier, time Stamp} 唯一确定的单元。cell中的数据全部是字节码形式存贮。
Hbase安装部署
1、首先保证zookeeper集群的正常并启动
[xxx@hadoop102 zookeeper]$zk.sh start
(我在虚拟机中编写了zookeeper的启动脚本,没有编写脚本的需在zookeeper的bin目录启动zkServer.sh start命令)。
2、启动hadoop
[xxx@hadoop102 hadoop]$myhadoop.sh start
(同样我也编写了hadoop的启动脚本,没有编写脚本的需在hadoop的sbin目录启动start-dfs.sh和start-yarn.sh命令)。
3、解压Hbase
解压Hbase的安装包到指定目录
[xxx@hadoop102 software]$tar -zxvf hbase-2.0.5-bin.tar.gz -C /opt/module
4、配置环境变量并source
[xxx@hadoop102 software]$sudo vim /etc/profile.d/my_env.sh #Hbase_HOME export Hbase_HOME=/opt/module/hbase export PATH=$PATH:$Hbase_HOME/bin
[xxx@hadoop102 software]$source /etc/profile
5、修改Hbase的配置文件
1)hbase-env.sh修改内容:
[xxx@hadoop102 software]$vim hbase-env.sh export Hbase_MANAGES_ZK=false
2)hbase-site.xml修改内容:
[xxx@hadoop102 software]$vim hbase-site.xmlhbase.rootdir hdfs://hadoop102:8020/hbase hbase.cluster.distributed true hbase.zookeeper.quorum hadoop102,hadoop103,hadoop104
3)修改regionservers:
[xxx@hadoop102 software]$vim regionservers hadoop102 hadoop103 hadoop104
6、分发集群
[xxx@hadoop102 software]$xsync hbase
7、启动Hbase
Hbase的启动分为单点启动和群启,建议使用群启这里只写群启命令
[xxx@hadoop102 hbase]$ bin/start-hbase.sh
8、查看Hbase页面
启动成功后,登录http://hadoop102:16010 查看Hbase的状态和更多信息
9、高可用(选做)
在Hbase中HMaster负责监控HRegionServer的生命周期,均衡RegionServer的负载,如果HMaster挂掉了,那么整个Hbase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以Hbase支持对HMaster的高可用配置。1)关闭Hbase集群(如果没有开启则跳过此步骤)
[xxx@hadoop102 hbase]$ bin/stop-hbase.sh
2)在conf目录下创建backup-masters文件
[xxx@hadoop102 hbase]$ touch conf/backup-masters
3)在backup-masters文件中配置高可用HMaster节点
[xxx@hadoop102 hbase]$ echo hadoop103 > conf/backup-masters
4)将整个conf目录scp到其他节点
[atguigu@hadoop102 hbase]$ xsync conf
5)重启hbase,打开页面测试查看
http://hadooo102:16010



