在了解HDFS写数据流程之前,我们先来了解HDFS是什么,干什么用的。
HDFS可以实现大数据的存储,并处理巨大的文件。而HDFS处理巨大文件的思路是将巨大的文件割成小块文件进行存储,称为”数据块分布式处理“。
接下来让我们看一下HDFS的写数据流程!其中Namenode(nn)是名称节点用来管理文件系统的命名空间。Datenode(dn)数据节点是分布式文件系统HDFS的工作节点,负责数据的存储和读取。
1.客户端向Namenode发出写数据请求。
2.nn检查目录。
3.可以上传。
4.查询dn信息,发送可以上传的dn.
5.客户端向dn发送请求上传的文件。
6.dn相互之间建立pipelin(管道:为后面传输black准备)。
7.上传数据,并向客户端,nn发送已上传完成信息。



