首先是自我介绍和项目介绍。
1、hdfs通过命令put一个文件的流程
服务端接受到写数据请求后,发送写数据请求到namenode生成元数据并写入,然后服务端根据元数据往datanode写具体的数据块。
然后被问如果写datanode失败数据不一致怎么解决,这里回答采用两阶段提交的方式去写元数据和实际数据,然后被怼那这样客户端崩了还是会存在问题。那我就说用zookeeper存储最后的数据,反正是key value的形式,然后被怼zookeeper同步效率很低。
2、讲述了一个项目,选择了数据统计分析可视化项目。
3、hbase的架构,写入数据流程
hbase由hmaster和regionserver组成,hmaster接受



