记录一次，HBase集群扩容节点后数据量暴增问题

前因后果
因为集群节点磁盘容量不足，于是计划对 Hbase 集群进行节点扩充，扩充完，也执行了数据均衡，刚开始暂时未发现问题，一周后发现有邮箱报警，显示节点空间已用80%,当时处于懵逼状态，心里暗想这才一周啊，刚扩容完怎么就满了呢？？？当打开hdfs的时候，整个人愣住了，仅仅一周时间数据量增加了100T！！！！卧槽？？这不是疯了吗？？我隐隐约约记得之前有人和我说过“我们的数据量每个月20T”，这才一周就100T了，生产队的驴也不敢这么造啊!?在百思不得其解的情况下进行了排查，并且增量数据并没有减少的意思，还在以每天20TB的速度前进…照这么下去，集群根本坚持不了一周，于是展开了速度与激情的数据闪电战。

战况图

排查过程
刚开始以为是数据源那边数据量增多，从而导致数据量变大，但是通过查看kafka的生产量，发现数据量并没有增大。

这个时候就迷茫了，不是数据量的问题难道是hdfs的问题？
想到是不是hdfs的副本增多了？之后查看发现并没有增多，还是默认的三个。
在网上疯狂寻找资料案例，但是空无所获…
在百般无奈，即将想放弃的时候…

光！要相信光！

突然想起，是不是因为忘记设置压缩的原因导致的，于是去查看新节点，发现果然没有设置压缩，旧的节点设置的是snappy压缩算法，新节点并未设置压缩。

一、前置准备

进入新节点查看是否有自带的压缩库

ll /usr/lib64 | grep snappy

删除掉自带的snappy库

yum -y remove snappy

安装所需依赖

sudo yum -y install gcc c++ autoconf automake libtool

二、下载snappy，版本要和旧节点的一样

wget https://src.fedoraproject.org/repo/pkgs/snappy/snappy-1.1.4.tar.gz/sha512/873f655713611f4bdfc13ab2a6d09245681f427fbd4f6a7a880a49b8c526875dbdd623e203905450268f542be24a2dc9dae50e6acc1516af1d2ffff3f96553da/snappy-1.1.4.tar.gz

安装snappy

tar zxvf snappy-1.1.4.tar.gz -C /usr/local/snappy

cd /usr/local/snappy/snappy-1.1.4

./autogen.sh

./configure

#如果make失败增加一步
autoreconf --force --install

make

make install

注：默认安装到/usr/local/lib目录

添加Snappy本地库至/usr/lib64目录下

cp -d /usr/local/lib/* /usr/lib64

三、安装hadoop-snappy

注：需要下载hadoop-snappy项目，需要用到maven进行编译

git clone git://github.com/electrum/hadoop-snappy
cd hadoop-snappy/
# 注：如果不做libjvm.so软链接，编译时会报错
ln -s /usr/local/tools/java-se-8u40-ri/jre/lib/amd64/server/libjvm.so /usr/local/lib/
mvn package

这里编译的时候可能会报错，首先检查以下maven的配置文件里是否配置了阿里云的仓库，我这里试了几下不知道为什么报错了，因为时间的原因，这一步索性就没做，因为旧的节点里面有编译好的文件和jar包，直接拷贝就行。
所需文件和jar包以上传至百度云
链接：https://pan.baidu.com/s/17CPQ_yuOFmjp33ZI6SkNwQ
提取码：1107
注意：文件通过编译出来的是链接，复制后变成一个文件了，不过我这里新节点也是从旧的节点拷贝过来的，也变成文件了，不过也能用。

jar包

文件

四、hadoop配置snappy

1、添加Snappy本地库至$HADOOP_HOME/lib/native/目录下

cp -d /usr/local/lib/* /usr/local/hadoop/hadoop-3.1.3/lib/native

2、将hadoop-snappy-0.0.1-SNAPSHOT.jar和snappy的library分别拷贝到
和HADOOP_HOME/lib/native/目录下即可

这部分拷贝的jar包和文件就是上面链接里的，不想编译的话直接下载解压上传进去就行，下载上面的文件后可省略此步

cp /home/hadoop/snappy/hadoop-snappy/target/hadoop-snappy-0.0.1-SNAPSHOT.jar $HADOOP_HOME/lib
cp /home/hadoop/snappy/hadoop-snappy/target/hadoop-snappy-0.0.1-SNAPSHOT-tar/hadoop-snappy-0.0.1-SNAPSHOT/lib/native/Linux-amd64-64/* $HADOOP_HOME/lib/native/

3、配置hadoop-env.sh和core-site.xml，mapred-site.xml

添加以下内容

vim hadoop-env.sh

export LD_LIBRARY_PATH=/usr/local/hadoop/hadoop-3.1.3/lib/native:/usr/local/lib/

vim core-site.xml

    
    
      io.compression.codecs
      
      org.apache.hadoop.io.compress.GzipCodec,
      org.apache.hadoop.io.compress.DefaultCodec,
      org.apache.hadoop.io.compress.BZip2Codec,
      org.apache.hadoop.io.compress.SnappyCodec
      
    
    
      io.compression.codec.lzo.class
      org.apache.hadoop.io.compress.SnappyCodec
    

vim mapred-site.xml

    
      mapreduce.output.fileoutputformat.compress
      true
    

   
      mapreduce.map.output.compress
      true
    
    
    
      mapreduce.output.fileoutputformat.compress.codec
      org.apache.hadoop.io.compress.SnappyCodec

4、验证

hadoop jar /usr/local/hadoop/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output

可以看到文件已经进行了压缩

五、Hbase配置snappy

将hadoop-snappy-0.0.1-SNAPSHOT.jar和snappy的library拷贝到$Hbase_HOME/lib目录下即可
也是上面链接里的jar包文件

cp /home/hadoop/snappy/hadoop-snappy/target/hadoop-snappy-0.0.1-SNAPSHOT.jar $Hbase_HOME/lib

mkdir -p $Hbase_HOME/lib/native/Linux-amd64-64/

cp /home/hadoop/snappy/hadoop-snappy/target/hadoop-snappy-0.0.1-SNAPSHOT-tar/hadoop-snappy-0.0.1-SNAPSHOT/lib/native/Linux-amd64-64/* $Hbase_HOME/lib/native/Linux-amd64-64/

配置hbase-env.sh和hbase-site.xml

vim hbase-env.sh

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/hadoop/hadoop-3.1.3/lib/native/:/usr/local/lib
export Hbase_LIBRARY_PATH=$Hbase_LIBRARY_PATH:/usr/local/hbase/hbase-2.1.7/lib/native/Linux-amd64-64/:/usr/local/lib/
export CLASSPATH=$CLASSPATH:$Hbase_LIBRARY_PATH

vim hbase-site.xml

  
      hbase.regionserver.codecs
      snappy

验证snappy
hbase org.apache.hadoop.hbase.util.CompressionTest file:///home/hadoop/ouput snappy

配置成功！

hbase shell

 create 'company', { NAME => 'department', COMPRESSION => 'snappy'}
 describe 'company'

安装好后，发现并不能解决问题，因为数据已经存进hdfs里了，所以需要对数据进行一次 hbase的major_compact 合并
所以重启一次hdfs，进行手动major_compact ‘’ hbase的表，使数据均衡且压缩

停止hbase

stop-hbase

重启dfs

stop-dfs.sh
start-dfs.sh

web页面查看dataNode是否上线，nameNode是否正常提供服务

开启hbase等待数据均衡

start-hbase.sh
访问web页面观察

手动major_compact合并region

hbase shell进入命令行
命令很快就会有结果，但是后台会一直运行，直到数据合并完
major_compact ‘要合并的表名’

观察服务是否正常，数据是否压缩
访问web页面查看是否所占磁盘减少

访问hbase web页面查看是否正在合并

至此，数据闪电战告一段落…

记录一次，HBase集群扩容节点后数据量暴增问题

大数据系统相关栏目本月热门文章