实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

大数据处理技术之flink初识

大数据系统更新时间：2026-05-30 05:36:59 发布时间：1638天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

一.产生背景

实时流数据增多 : 互联网应用快速发展,实时流数据日益增多
价值更大: 实时流数据的处理和挖掘带来的价值比离线数据处理要多
大厂需求 : 各大互联网厂商需要一个能够快速响应和处理大规模实时流数据的技术
其他流处理引擎不能够满足需求 : storm/jstorm,sparkstreaming等
- 优秀的流处理引擎要求
  - 低延时,高吞吐,容错性好,窗口时间语义化,编程效率高,运行效果好
- storm/jstorm
  - 优点
    - 低延时
  - 缺点
    - 其他的都差一些
- sparkstreaming
  - 优点
    - 高吞吐,容错性好
  - 缺点
    - 其他的都差一些

二.flink基本介绍 1.概念

Apache基金会开发的分布式的开源的流处理框架
scala和java编写
用于对有界和无界数据流进行有状态的计算
- 有界数据流:即实时数据流
- 无界数据流:即离线数据流,也称批处理数据

2.特点

适用所有常见的集群环境
内存计算,大规模处理
满足实时流处理引擎的全部需求
- 低延迟
- 高吞吐
- 容错性好
- 窗口时间语义化
- 编程效率高

3.应用场景

事件驱动型应用
数据分析型应用
数据管道ETL
要求严格的实时流处理场景

4.代码实现

实现方式
- javaAPI
- scalaAPI
数据处理过程抽象
- 将实时和离线数据处理的过程,均抽象成三个过程,及Source->Transform->Sink
  - Source 源数据读取
  - Transform 数据的转换
  - Sink 数据的落地
代码实现的复杂度
- API丰富,支持SQL,复杂度不高

三.版本发展与介绍

flink0.6 初步得到团队认可,快速迭代发展 2014年
flink0.9-milestone 有重大进展,正式对外发布 2015年
flink0.9 阿里引入,并进行了优化改名blink 2015年
flink1.0 里程碑 2016年
flink1.9 目前市场占有率较高的版本 2019年
flink1.1 加入了很多特性,支持hadoop3.x版本
flink1.13.1 版本稳定

四.市场背景

现实情况
- 学习成高,开发人员少
- flink主要是互联网大厂在使用
发展趋势
- 实时数据处理需求逐渐变大
- flink对于实时数据的处理表现优异
- 得到了阿里的支持,发展前景极好

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/629344.html

上一篇尚硅谷数据仓库实战之1项目需求及架构设计

下一篇 Shuffle过程详解

大数据系统相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号