栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

HBase的简介和安装

HBase的简介和安装

Hbase简介

(1)Hbase的定义
Hbase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。

(2)Hbase数据模型
逻辑上,Hbase的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列。但是从Hbase的底层物理存储结构来看,Hbase更像是一个multi-dimensional map(多维地图/多维映射)。

(3)数据模型
1)Hbase的数据模型由namespace、table等组成…

    namespace:
      命名空间,类似于关系型数据库中database的概念。每个命名空间下有多个表。Hbase自带俩个命名空间,分别是hbase和default。hbase中存放的是Hbase内置的表,default表是用户默认使用的命名空间。如果用户直接创建表,则该表存储与default中。
    2)Table:
      类似于关系数据库中table的概念,与之不同的是,Hbase定义表时只需声明列族即可,不需要声明具体的列。和关系型数据库相比,Hbase能够轻松应对字段变更的场景。
    3)Row:
      Hbase表中的每行数据都由一个RowKey和多个Column组成,数据是按照RowKey的字典顺序存储的,并且查询数据只能通过RowKey进行检索。
      4)Column:
        Hbase中每个列都有ColumnFamily(列族)和ColumnQualifier(列限定符)进行限定,例如:msg:name,info:gender。建表时,只需指明列族,而限定列符无需提前定义。
        5)timeStamp
          用户标识数据的不同版本(version),每条数据写入时,系统会自动为其加上该字段,其值为Hbase写入的时间。
          6)Cell
            由{rowkey, column Family:column Qualifier, time Stamp} 唯一确定的单元。cell中的数据全部是字节码形式存贮。
Hbase安装部署

1、首先保证zookeeper集群的正常并启动

[xxx@hadoop102 zookeeper]$zk.sh start

(我在虚拟机中编写了zookeeper的启动脚本,没有编写脚本的需在zookeeper的bin目录启动zkServer.sh start命令)。

2、启动hadoop

[xxx@hadoop102 hadoop]$myhadoop.sh start

(同样我也编写了hadoop的启动脚本,没有编写脚本的需在hadoop的sbin目录启动start-dfs.sh和start-yarn.sh命令)。
3、解压Hbase
解压Hbase的安装包到指定目录

[xxx@hadoop102 software]$tar -zxvf hbase-2.0.5-bin.tar.gz -C /opt/module

4、配置环境变量并source

[xxx@hadoop102 software]$sudo vim /etc/profile.d/my_env.sh
#Hbase_HOME
export Hbase_HOME=/opt/module/hbase
export PATH=$PATH:$Hbase_HOME/bin
[xxx@hadoop102 software]$source /etc/profile

5、修改Hbase的配置文件
1)hbase-env.sh修改内容:

[xxx@hadoop102 software]$vim hbase-env.sh
export Hbase_MANAGES_ZK=false

2)hbase-site.xml修改内容:

[xxx@hadoop102 software]$vim hbase-site.xml

    
        hbase.rootdir
      hdfs://hadoop102:8020/hbase
    
    
        hbase.cluster.distributed
        true
    
    
        hbase.zookeeper.quorum
    hadoop102,hadoop103,hadoop104
    

3)修改regionservers:

[xxx@hadoop102 software]$vim regionservers
hadoop102
hadoop103
hadoop104

6、分发集群

[xxx@hadoop102 software]$xsync hbase

7、启动Hbase
Hbase的启动分为单点启动和群启,建议使用群启这里只写群启命令

[xxx@hadoop102 hbase]$ bin/start-hbase.sh

8、查看Hbase页面
启动成功后,登录http://hadoop102:16010 查看Hbase的状态和更多信息

9、高可用(选做)

在Hbase中HMaster负责监控HRegionServer的生命周期,均衡RegionServer的负载,如果HMaster挂掉了,那么整个Hbase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以Hbase支持对HMaster的高可用配置。

1)关闭Hbase集群(如果没有开启则跳过此步骤)

[xxx@hadoop102 hbase]$ bin/stop-hbase.sh

2)在conf目录下创建backup-masters文件

[xxx@hadoop102 hbase]$ touch conf/backup-masters

3)在backup-masters文件中配置高可用HMaster节点

[xxx@hadoop102 hbase]$ echo hadoop103 > conf/backup-masters

4)将整个conf目录scp到其他节点

[atguigu@hadoop102 hbase]$ xsync conf

5)重启hbase,打开页面测试查看
http://hadooo102:16010

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/316348.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号