实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

FLINK 学习随笔一

大数据系统更新时间：2026-05-21 15:59:59 发布时间：1578天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

Flink 如何支持事件驱动的应用程序？
事件驱动应用程序的限制取决于流处理器处理时间和状态的能力。Flink 的许多出色功能都围绕这些概念展开。Flink 提供了一组丰富的状态原语，可以管理非常大的数据量（高达数 TB），并保证一次性一致性。此外，Flink 对事件时间的支持、高度可定制的窗口逻辑以及对时间的细粒度控制，ProcessFunction使高级业务逻辑的实现成为可能。此外，Flink 还提供了一个用于复杂事件处理（CEP）的库来检测数据流中的模式。

但是，Flink 对于事件驱动应用程序的突出特点是保存点。保存点是一致的状态图像，可用作兼容应用程序的起点。给定一个保存点，可以更新应用程序或调整其规模，或者可以启动应用程序的多个版本进行 A/B 测试。

借助复杂的流处理引擎，还可以实时执行分析。流式查询或应用程序不是读取有限的数据集，而是摄取实时事件流，并随着事件的消耗不断产生和更新结果。结果要么写入外部数据库，要么作为内部状态进行维护。Dashboard 应用程序可以从外部数据库读取最新结果或直接查询应用程序的内部状态。

Flink 如何支持数据分析应用？
Flink 的 DataStream API 或 DataSet API 提供了更多的底层控制。此外，Flink 的 Gelly 库为批量数据集的大规模和高性能图形分析提供了算法和构建块。

什么是数据管道？
Extract-transform-load (ETL) 是一种在存储系统之间转换和移动数据的常用方法。通常会定期触发 ETL 作业，以将数据从事务数据库系统复制到分析数据库或数据仓库。

数据管道的用途与 ETL 作业类似。他们转换和丰富数据，并可以将其从一个存储系统移动到另一个存储系统。但是，它们以连续流模式运行，而不是定期触发。因此，他们能够从持续生成数据的源中读取记录，并以低延迟将其移动到目的地。例如，数据管道可能会监视文件系统目录中的新文件并将其数据写入事件日志。另一个应用程序可能将事件流具体化到数据库或增量构建和细化搜索索引。

下图描述了周期性 ETL 作业和连续数据管道之间的区别。

Flink 如何支持数据管道？
Flink 的 SQL 接口（或 Table API）及其对用户定义函数的支持可以解决许多常见的数据转换或丰富任务。使用更通用的 DataStream API 可以实现更高要求的数据管道。Flink 为各种存储系统提供了丰富的连接器集，例如 Kafka、Kinesis、Elasticsearch 和 JDBC 数据库系统。它还具有用于文件系统的连续源，用于监视以分时方式写入文件的目录和接收器。

DataStream API 的深度批处理/流式统一
DataStream API是 Flink 的物理API，用于用户需要非常明确地控制数据类型、流、状态和时间的用例。此 API 正在不断发展，以支持对有界数据的高效批处理执行。

统一的 SQL 平台
社区一直在将 Flink 构建为统一（批处理和流式）SQL 分析平台的强大基础，并将继续这样做。

SQL 具有非常强大的跨批处理流语义，允许用户将相同的查询用于临时分析和连续查询。Flink 已经包含一个高效的统一查询引擎，以及广泛的集成。随着用户的反馈，这些得到不断改进。

更多连接器和变更数据捕获支持

Change-Data-Capture：通过附加到事务日志，直接从数据库中捕获数据更改流。社区正在增加更多的 CDC 集成。
External CDC connectors: Flink Ecosystem WebsiteBackground: FLIP-105 (CDC support for SQL) and Debezium.Data Lake Connectors：统一流式处理和批处理是 Data Lakes 的一个强大的价值主张：支持相同的 API、语义和引擎，用于对历史数据进行流式实时处理和批处理。社区正在增加与各种数据湖系统的更深层次的集成
Apache Iceberg: Getting Started - Apache IcebergApache Hudi: https://hudi.apache.org/blog/apache-hudi-meets-apache-flink/

好书连接：《Flink原理与实践》：中文领域最详细的Flink入门教程 | Weizheng

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/710456.html

上一篇第一个JDBC程序

下一篇开始使用Elasticsearch (2): 了解如何进行搜索

大数据系统相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号