栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 系统运维 > 运维 > Linux

大数据开发教程合集——需要学习哪些内容?

Linux 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

大数据开发教程合集——需要学习哪些内容?

对于零编程基础的人来说,先学Java:
  • Java基础
  • MySql数据库
  • xml和json数据结构的解析
  • Linux的基本操作
  • Maven项目构建工具
  • Git分布式版本控制工具

掌握以上内容以后,就可以开始学习架构部分,有基础的同学可以直接学习进阶内容。

第一阶段:
  • 大数据开发的基本概念
  • 大数据概况及Hadoop环境构建
  • Apache Hadoop 分布式文件系统
  • MapReduce 编程模型基础和实战
  • Hive-数据仓库基础
  • Hive-数据仓库进阶
  • Hive-数据仓库实战
  • Nosql综述和ApacheHBase基础
  • Apache Hbase 进阶及性能优化
  • Apache Sqoop介绍及数据迁移
  • ZooKeeper的核心设计和企业级应用
  • 企业级离线数据仓库项目实战开发
第二阶段:
  • Scala编程基础
  • Scala编程进阶
  • Apache Spark基础及架构
  • Apache Spark分布式计算原理
  • Spark SQL精华及与Hive的集成
  • Spark Performance Tuning(性能调优)
  • Spark Streaming的流数据处理和分析
  • 基于Spark GraphX的图形数据分析
  • Spark ML /MLlib建立日志推荐模型
  • Flink任务调度原理与资源分配
  • Flink-Streaming State核心设计与实践
  • Flink-Streaming WasterMark核心设计与实践
  • Flink-Streaming Window核心设计与实践
  • Flink-Streaming企业应用
  • Flink SQL企业实践
  • Hadoop数据模型及应用架构介绍
  • Spark 综合面试题训练讲解
  • 中大型企业级离线数据分析平台
  • 基于Hadoop的二次源码项目开发
  • 基于FlinkCDC的数据集成项目实战
  • 基于FlinkCDC的数据集成项目实战
第三阶段:
  • 股票交易实时数据仓库建设
  • MOOC在线教育题库大数据推荐系统
  • Spark内核企业级调优
  • SparkSQL核心组件原理
  • 实时流存储性能优化-Kafka服务端源码核心设计剖析
  • 实时流存储性能优化-Kafka企业级生产环境调优技巧
  • Apache Flink核心源码流程
  • 数据中台构建
  • 基于Apache Flink可视化的、轻量级的综合web客户端系统研发
  • OLAP分析引擎ClickHouse
  • OLAP分析引擎Doris
  • OLAP分析引擎Kylin
  • 企业级大数据CDH/HDP集群运维-提升系统的高可靠性
  • 企业级大数据CDH/HDP集群运维-提升Hive的高可靠性
  • 企业级大数据CDH集群运维-提升系统的安全性 - 认证(Authentication)
  • 企业级大数据CDH/HDP集群运维-授权(Authorizatioin)及审计(Auditing)
  • 企业级大数据CDH/HDP集群运维-数据保护

在本教程中,我们会将以上所有的内容一一进行介绍,点赞收藏防走丢。

更多资料和开发环境配置戳⬇⬇⬇

免费领取大数据学习资料

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/974603.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号