栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Flume 基础概述(体系架构、执行流程、事务)

Flume 基础概述(体系架构、执行流程、事务)

Flume 基础概述

概述
概念

Flume是一个分布式、可靠、和高可用的海量日志聚合的系统Flume 官网 作用

1、支持在系统中定制各类数据发送方,用于收集数据2、同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 应用场景

1、线上数据一般主要是落地(存储到磁盘)或者通过socket传输给另外一个系统2、这种情况下,你很难推动线上应用或服务去修改接口,实现直接向kafka里写数据3、这时候你可能就需要flume这样的系统帮你去做传输。 Flume的体系架构


核心组件

1、Client(客户端)

1、Client 生产数据,运行在一个独立的线程

2、Event(事件)

1、一个数据单元,由 消息头和消息体组成2、Events 可以是日志记录、 avro 对象等

3、Flow(流)

1、 Event 从源点到达目的点的迁移的抽象

4、Agent(代理)

1、 一个独立的Flume进程,包含组件Source、 Channel、 Sink2、每台机器运行一个agent,但是可以在一个agent中包含多个 sources和 sinks3、Agent使用 JVM 运 行Flume

5、Source(源)

1、source从Client收集数据,传递给Channel2、 数据收集组件

6、Channel(通道)

1、负责接收 source 端的数据,并将其推送到持久系统或者是 sink 端2、 中转Event的一个临时存储,保存由Source组件传递过来的 Event3、Channel 连接 sources 和 sinks ,这个有点像一个消息队列

7、Sink(存储)

1、从Channel中读取并移除Event, 将 Event 传递到 FlowPipeline 中的下一个 Agent2、如果有的话,Sink从Channel收集数据,运行在一个独立线程

8、selector(选择器)

1、作用于 source 端,然后决定数据发往哪个目标

9、interceptor(拦截器)

1、flume 允许使用拦截器拦截数据2、允许使用拦截器链,作用于 source 和 sink 阶段 Flume优点


1、峰值处理

当收集数据的速度超过将写入数据的时候,也就是当收集信息遇到峰值时,这时候收集的信息非常大,甚至超过了系统的写入数据能力,此时,Flume会在数据生产者和数据收容器间做出调整,保证其能够在两者之间提供平稳的数据

2、Flume的管道是基于事务,保证了数据在传送和接收时的一致性

3、 Flume是可靠的,容错性高的,可升级的,易管理的,并且可定制的

可以根据生产需要自行定义一个数据来源端或者终点端

4、 支持多路径流量,多管道接入流量,多管道接出流量,上下文路由等

Flume 执行流程

执行流程

1、Source 接受数据2、Channel Processor 处理 Event3、 Channel Processor 将 Event 传递给 interceptor 链对 Event 进行过滤操作4、过滤完之后再把 Event 发送回 Channel Prodessor5、Channel Processor把 Event 发送给 Channel selectors6、Channel selector返回 Event 属于哪个Channel7、根据第6步返回的结果,将Event 发送到指定的 Channel8、SinkProcessor 从 Channel 中拉取数据9、最后把数据 Sink出去 Flume 事务


推送事务流程

1、doPut: 把批数据写入到临时缓冲区putList2、doCommit: 检查Channel容量是否足够,如果容量足够则把 putList 里的数据发送到 Channel3、doRollBack: 如果Channel 容量不够,则把数据回滚到 putList 拉取事务流程

1、doTake: 把数据读取到临时缓冲区 takeList2、doCommit: 检查数据是否发送成功,成功的话,则把event从takeList中移除3、doRollBack: 如果发送失败,则把 takeList的数据回滚数据到 Channel 可靠性

1、只有当sink接收到,数据落地完成的信息之后,才会将数据从通道中删除2、数据传输的方式不是byte,而是一个个的 event 可恢复

1、当数据丢失了,只有从存储在磁盘的方式,才能将数据找回


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/735847.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号