栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

hadoop2命令集

hadoop2命令集

归档(archives)

hadoop归档是一个专用的格式. hadoop归档映射文件系统目录,归档总是用*.har做扩展名.归档目录包含元数据(用_index和_masterindex格式)和数据(part-*)文件. _index文件中包含这部分归档的文件内容和位置.

Usage: hadoop archive -archiveName name -p  [-r ] * 
# 归档文件
hadoop archive -archiveName input.har –p  /input   /output

# 查看归档
hadoop fs -lsr //output/input.har(看到的索引等信息)
hadoop fs -lsr har:output/input.har(看到的归档中的具体文件)

# 解归档文件
hdfs dfs -cp har:///user/zoo/foo.har/dir1 hdfs:/user/zoo/newdir

# 并发解压归档
hadoop distcp har:///user/zoo/foo.har/dir1 hdfs:/user/zoo/newdir

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/329804.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号