- Java基础
- MySql数据库
- xml和json数据结构的解析
- Linux的基本操作
- Maven项目构建工具
- Git分布式版本控制工具
掌握以上内容以后,就可以开始学习架构部分,有基础的同学可以直接学习进阶内容。
第一阶段:- 大数据开发的基本概念
- 大数据概况及Hadoop环境构建
- Apache Hadoop 分布式文件系统
- MapReduce 编程模型基础和实战
- Hive-数据仓库基础
- Hive-数据仓库进阶
- Hive-数据仓库实战
- Nosql综述和ApacheHBase基础
- Apache Hbase 进阶及性能优化
- Apache Sqoop介绍及数据迁移
- ZooKeeper的核心设计和企业级应用
- 企业级离线数据仓库项目实战开发
- Scala编程基础
- Scala编程进阶
- Apache Spark基础及架构
- Apache Spark分布式计算原理
- Spark SQL精华及与Hive的集成
- Spark Performance Tuning(性能调优)
- Spark Streaming的流数据处理和分析
- 基于Spark GraphX的图形数据分析
- Spark ML /MLlib建立日志推荐模型
- Flink任务调度原理与资源分配
- Flink-Streaming State核心设计与实践
- Flink-Streaming WasterMark核心设计与实践
- Flink-Streaming Window核心设计与实践
- Flink-Streaming企业应用
- Flink SQL企业实践
- Hadoop数据模型及应用架构介绍
- Spark 综合面试题训练讲解
- 中大型企业级离线数据分析平台
- 基于Hadoop的二次源码项目开发
- 基于FlinkCDC的数据集成项目实战
- 基于FlinkCDC的数据集成项目实战
- 股票交易实时数据仓库建设
- MOOC在线教育题库大数据推荐系统
- Spark内核企业级调优
- SparkSQL核心组件原理
- 实时流存储性能优化-Kafka服务端源码核心设计剖析
- 实时流存储性能优化-Kafka企业级生产环境调优技巧
- Apache Flink核心源码流程
- 数据中台构建
- 基于Apache Flink可视化的、轻量级的综合web客户端系统研发
- OLAP分析引擎ClickHouse
- OLAP分析引擎Doris
- OLAP分析引擎Kylin
- 企业级大数据CDH/HDP集群运维-提升系统的高可靠性
- 企业级大数据CDH/HDP集群运维-提升Hive的高可靠性
- 企业级大数据CDH集群运维-提升系统的安全性 - 认证(Authentication)
- 企业级大数据CDH/HDP集群运维-授权(Authorizatioin)及审计(Auditing)
- 企业级大数据CDH/HDP集群运维-数据保护
在本教程中,我们会将以上所有的内容一一进行介绍,点赞收藏防走丢。
更多资料和开发环境配置戳⬇⬇⬇免费领取大数据学习资料



