知识源于积累,登峰造极源于自律. 整理自己发在博客上的大数据笔记,方便查找。索引持续更新中…
大数据开发(基础笔记) LinuxLinux命令收集
Hadoop什么是大数据
从Hadoop框架讨论大数据生态
hadoop组成模块及各模块的简介
hadoop组成模块之HDFS分布式存储详解
hadoop组成模块之HDFS-HA高可用
hadoop组成模块之MapReduce概述
MapReduce框架原理之InputFormat数据输入
hadoop组成模块之mapreduce的MapTask机制和reduceTask机制
mapreduce过程中的shuffle机制原理
hadoop组成模块之Yarn资源调度器
hadoop组成模块之Yarn-HA高可用
hadoop模块组成之Join多种应用
hadoop的计数器应用和数据清洗
Hadoop数据压缩
Hadoop企业优化
Hadoop生产调优手册
ZookeeperZookeeper简介
Hivehive简介(一)
hive简介(二)
hive常用函数收录
SparkSpark基础解析
SparkCore之RDD概述
SparkCore之RDD编程的编程模型
Streamxstreamx源码编译及安装部署-服务器端编译
streamx源码编译及安装部署-本地编译(推荐)
FlinkFlink简介



