栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

HDFS

HDFS

HDFS_05_元数据

持续更新大数据文章…

1. 一个文件包含的内容

我们现在学的是 HDFS,HDFS是用来储存文件的,那么我们有必要了解一个文件包含了哪些内容

一个文件内容可以大体分为两个部分:元数据、真实数据。

1.1 元数据

元数据是用来描述文件基本信息的数据,比如:

  • 文件大小
  • 文件用户-组-权限
  • 文件创建时间等…

如果是这个文件要上传到 HDFS,那么元数据至少要包含:

  • 文件对应的数据块信息

  • 文件的数据块副本数量

  • 文件大小

  • 文件用户-组-权限

  • 文件创建时间等…

补充说明一下:

  • 一个文件中的块大小必须相同,除了最后一个块的大小
  • 数据块大小一旦被确定就不能被修改,数据块默认大小是 128MB
  • 文件对应的数据块副本数可以被修改,但是一般副本数为3个
1.2 真实数据

文件真正存放的内容,这个数据就是存储在硬盘上的二进制数据。



下期讲解 HDFS_06_HDFS服务器节点的分类......

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/603990.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号