栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

flume学习一

flume学习一

定义:

flume是一个高可用、高可靠、分布式的,日志采集、聚合、传输的系统。只能是日志类型的数据,图片视频这样的数据不行。

作用:

flume的作用就是从本地磁盘读取数据再将数据传到HDFS 做离线分析

flume架构 :数据来源--->flume--->数据去向

flume组件:

source:Source 是负责接收数据到 Flume Agent 的组件。Source 组件可以处理各种类型、各种 格式的日志数据,包括 avro、thrift、exec、jms、spooling directory、netcat、sequence generator、syslog、http、legacy。(flume中用来接受从wedServer读取的数据,跟外界打交道。读文件、端口数据等) avro用于多层flume

channel:作用就是起到缓冲的作用

sink:Sink 不断地轮询 Channel 中的事件且批量地移除它们,并将这些事件批量写入到存储 或索引系统、或者被发送到另一个 Flume Agent。 Sink 组件目的地包括 hdfs、logger、avro、thrift、ipc、file、Hbase、solr、自定 义。

agent:Agent 是一个 JVM 进程,它以事件的形式将数据从源头送至目的。 Agent 主要有 3 个部分组成,Source、Channel、Sink。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/689642.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号