栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 其他

hdfs纠删码

其他 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

hdfs纠删码

说明
  • 本博客每周五更新一次。
  • 纠删码是hadoop3提供新的数据备份方案,和原副本方向相比,通过计算方式,使用更少的存储,以达到数据安全的目标。
  • 纠删码策略以路径设置单元,该路径下所有存储文件,都以设置策略存储,默认RS-6-3-1024k。如使用其他策略需提前开启。
  • 当某节点数据单元或效验单元丢失,总数据单元和效验单元数不低于可恢复数,hadoop集群将在一段时间后,自动恢复该节点数据。
分享
  • 大数据博客列表
记录 命令
  • 纠删码命令:hdfs ec
  • 查看支持的纠删码编码:hdfs ec -listPolicies
  • 开启RS-3-2-1024k策略:hdfs ec -enablePolicy -policy RS-3-2-1024k
纠删码类型
  • 纠删码当前有5种格式,每种都有各自的特色。数据可恢复最低数,为集群服务器最小数。
名称算法数据单元个数效验单元个数总数最低数单元大小
RS-3-2-1024krs32531024k=1024*1024=1048576
RS-10-4-1024krs10414101024k=1024*1024=1048576
RS-6-3-1024k(默认)rs63961024k=1024*1024=1048576
RS-LEGACY-6-3-1024krs-legacy63961024k=1024*1024=1048576
XOR-2-1-1024kxor21321024k=1024*1024=1048576
设置纠删码策略
  • 纠删码策略默认只开启 RS-6-3-1024k,要使用其他策略需要先开启。
  • 将/input目录设置为RS-3-2-1024k策略
    • 开启RS-3-2-1024支持:hdfs ec -enablePolicy -policy RS-3-2-1024k,disable改为enable
    • hdfs创建目录,并设置RS-3-2-1024k
      • 创建目录:hadoop fs -mkdir /input
      • 设置策略:hdfs ec -setPolicy -path /input -policy RS-3-2-1024k
结论
  • 纠删码和副本是两种不同数据安全策略,没有绝对的好坏,具体根据集群情况而定,如果集群存储多计算少,使用副本方案,存储少计算多使用纠删码。
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/279549.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号