栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

hbase ImportTsv的使用

hbase ImportTsv的使用

importTsv的使用

importTsv 是一个将 TSV 格式的数据加载到 Hbase 的工具类。它有两种不同的用法:1.通过 Puts 将 HDFS 中的 TSV 格式的数据加载到 Hbase 中;2.通过生成StoreFile的方式使用completebulkload将数据加载到Hbase中。

通过 Puts 将 HDFS 中的 TSV 格式的数据加载到 Hbase 中
$ bin/hbase org.apache.hadoop.hbase.mapreduce.importTsv '-Dimporttsv.separator=|' -Dimporttsv.columns=a,b,c  
  • ‘-Dimporttsv.separator=|’ 指定列之间的分隔符
  • -Dimporttsv.columns 指定列族
  • tablename 指定hbase表名
  • hdfs-inputdir 指定数据文件在hdfs上的存放路径
通过生成StoreFile的方式使用completebulkload将数据加载到Hbase中 1.生成StoreFile
$ bin/hbase org.apache.hadoop.hbase.mapreduce.importTsv '-Dimporttsv.separator=|' -Dimporttsv.columns=a,b,c -Dimporttsv.bulk.output=hdfs://storefile-outputdir  
  • ‘-Dimporttsv.separator=|’ 指定列之间的分隔符
  • -Dimporttsv.columns 指定列族
  • -Dimporttsv.bulk.output=hdfs://storefile-outputdir 指定StoreFile的生成路径
  • tablename 指定hbase表名
  • hdfs-data-inputdir 指定数据文件在hdfs上的存放路径
2.将生成的StoreFile通过completebulkload加载到hbase中
HADOOP_CLASSPATH=`${Hbase_HOME}/bin/hbase classpath` ${HADOOP_HOME}/bin/hadoop jar ${Hbase_HOME}/hbase-mapreduce-VERSION.jar completebulkload  
  • hbase-mapreduce-VERSION.jar hbase对应version的jar包
  • hdfs://storefileoutput 生成StoreFile在hdfs上的路径
  • tablename hbase表名

注意:这里有第二种将StoreFile加载到hbase表中的方法

$ bin/hbase org.apache.hadoop.hbase.tool.LoadIncrementalHFiles  
  • hdfs://storefileoutput 生成StoreFile在hdfs上的路径
  • tablename hbase表名
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/690084.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号