1.客户端通过调用分布式文件系统对象中的Open()函数来读取它所需要的数据。
2.Distributed File System 会通过RPC协议调用名称节点来确定请求文件块所在的位置。
3.对输入流调用Read()方法。
4.FSDataInputSream连接保存此文件第一个数据块的最近的数据节点,并以数据流的形式读取数据,客户端多次调用Read(),直接到达数据块结束位置。
5.当第一个块读取完毕时,DFSDataInputStream会关闭连接,并查找存储下一个数据库距离客户端最近的数据节点。
6.客户端按照打开和数据节点连接返回的数据流的顺序读取该块,他也会调用名称节点来检查下一组所在的数据节点的位置信息。
7.完成所有文件读取后,客户端会在DFSDataInputStream中调用Close()函数关闭数据流。



