有关HDFS写流程的系列文章:
【精】彻底吃透HDFS写流程(1)–BlockConstructionStage
【精】彻底吃透HDFS写流程(2)-- Namenode侧create文件
【精】彻底吃透HDFS写流程(3)-- DataStreamer线程和输出流write方法简要分析
上一篇文章中,我们简要介绍了DataStreamer线程类run方法的功能,以及DFSOutputStream的write方法所做的事。
按照时序,本文我们先来详细的分析一下write方法。DataStreamer线程类run方法新开一篇文章再详细分析。
DFSOutputStream是FSOutputSummer的子类。并且没有重写write方法,如下图所示,IDEA的structure视图中方法显示灰色并且有箭头指向方法继承自那个类。
我们使用HDFS API写数据一般会用含有3个参数的write方法:



