栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Flume前提回顾

Flume前提回顾

Flume进阶使用

前提回顾
flume是以三大部分组成

  • agent:flume 的组成单位,包括了Source,Channel,Sink

  • Source
  1. netcat:官方提供的端口监控组件
  2. exec 用于监控Linux中的命令的(tail-F)
  3. Spooldir:监控一个目录的。如果目录中出现了新的文件,就文件内容采集过来。
  4. taildir:监控多文件,维护offset(支持断点续传 根据计算下载时记载在json中的系统偏移量来实现断点续传)
  5. Kafka

  • Channel
  1. memorychannel:基于内存
  2. filechannel:基于硬盘
  3. Kafka

  • Sink
  1. HDFS
  2. Logger
  3. Kafaka
  4. Hbase
  5. Hive

  • event:是S,C,K中传输时最小的单位 是由(header:属性,body:数据,字节数组形式存在)

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/336266.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号