栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

【Flume总结】Flume 数据流监控

【Flume总结】Flume 数据流监控

组件:Ganglia
Ganglia 由 gmond、gmetad 和 gweb 三部分组成。 gmond(Ganglia Monitoring Daemon)是一种轻量级服务,安装在每台需要收集指标数 据的节点主机上。使用 gmond,你可以很容易收集很多系统指标数据,如 CPU、内存、磁盘、 网络和活跃进程的数据等。 gmetad(Ganglia meta Daemon)整合所有信息,并将其以 RRD 格式存储至磁盘的服务。 gweb(Ganglia Web)Ganglia 可视化工具,gweb 是一种利用浏览器显示 gmetad 所存储 数据的 PHP 前端。在 Web 界面中以图表方式展现集群的运行状态下收集的多种不同指标数 据。
准备工作 一、规划:
hadoop102: web gmetad gmod hadoop103: gmod hadoop104: gmod
二、安装和配置文件

1、在hadoop102上进行监控,其他两台机器也要安装Ganglia

2、如果想通过Windows网页访问Ganglia的界面,需要使用VM8的IP地址来配置ip地址:

(1)sudo vim /etc/httpd/conf.d/ganglia.conf ,修改一下配置:

# Ganglia monitoring system php web frontend
#
Alias /ganglia /usr/share/ganglia

 # Require local
 # 通过 windows 访问 ganglia,需要配置 Linux 对应的主机(windows)ip 地址
 Require ip 192.168.10.102    
 # Require ip 10.1.2.3
 # Require host example.org

 (2)Windows端,cmd -> ipconfig,复制VM8的ip地址,修改上面的ip。

 (3)如果不改ip地址,就只能在Linux里的浏览器中访问网页端。http://hadoop102/ganglia

 三、操作 Flume 测试监控
1)启动 Flume 任务  hadoop102端:       
 sudo systemctl start gmond
 sudo systemctl start httpd
 sudo systemctl start gmetad

bin/flume-ng agent -c conf/ -n a1 -f job/flume-netcat-logger.conf -Dflume.root.logger=INFO,console -Dflume.monitoring.type=ganglia -Dflume.monitoring.hosts=hadoop102:8649
2)发送数据观察 ganglia 监测图        
 nc localhost 44444
 四、监控信息

进去后的界面:

跳转到hadoop102:

 

可以看到可以监控到以下信息:

 点击 flume metrics,查看flume具体的监控信息:

 监控信息如下表:

怎么通过这些指标发现问题呢?

1、如果PutAttemptCount 和PutSuccessCount这两项的数据量差异较大,有可能出现内存问题,这时候可以通过修改配置信息来解决问题,配置信息路径:/flume/conf/flume-env.sh.template

进去后把下面这行注释给去掉,-Xms:最小内存,-Xmx:最大内存

 最后要把文件后缀.template去掉,否则系统不会读取该文件。

2、判断数据在传输过程中是否出现丢失。

如果 channelsize = putSucess + takeSucess ,那么没有发生数据丢失,如果等式不成立,发生了数据丢失。

 

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/698707.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号