性能测试之硬件指标采集nmon
一、介绍nmon
定义:nmon,帮助在一个屏幕上显示所有重要的性能优化信息,并动态地对其进行更新。
二、工具
(1)分析 AIX 和 Linux 性能的免费工具,
(2)nmon 工具还可以将相同的数据捕获到一个文本文件,便于以后对报告进行分析和绘制图形。输出文件采用电子表格的格式 (.csv)。
三、nmon采集的数据包括:
(1)CPU 使用率
(2)内存使用情况
(3)内核统计信息和运行队列信息
(4)磁盘 I/O 速度、传输和读/写比率
(5)文件系统中的可用空间
(6)磁盘适配器
(7)网络 I/O 速度、传输和读/写比率
(8)页面空间和页面速度
(9)CPU 和 AIX 规范
(10)消耗资源最多的进程
(11)IBM HTTP Web 缓存
(12)用户自定义的磁盘组
(13)计算机详细信息和资源
(14)异步 I/O,仅适用于 AIX
(15)工作负载管理器 (WLM),仅适用于 AIX
=============================================
nmon 安装
1、下载好nmon安装包
2、将nmon包上传到linux中
3、解压
4、nmon_x86_sles11 文件授权和修改
(1)chmod 777 nmon_x86_sles11
(2)mv nmon_x86_sles11 n 修改启动文件名
5、启动nmon ./
6、进入nmon界面
q : 停止并退出 Nmon
h : 查看帮助
c : 查看 CPU 统计数据
m : 查看内存统计数据
d : 查看硬盘统计数据
k : 查看内核统计数据
n : 查看网络统计数据
N : 查看 NFS 统计数据
j : 查看文件系统统计数据
t : 查看高耗进程
V : 查看虚拟内存统计数据
v : 详细模式
==========================
q : 停止并退出 Nmon
h : 查看帮助
c : 查看 CPU 统计数据
m : 查看内存统计数据
d : 查看硬盘统计数据
k : 查看内核统计数据
n : 查看网络统计数据
N : 查看 NFS 统计数据
j : 查看文件系统统计数据
t : 查看高耗进程
V : 查看虚拟内存统计数据
v : 详细模式
================================================
采集数据 #./nmon -s10 -c60 -f -m /home/
-s10 每 10 秒采集一次数据
-c60 采集 60 次,即为采集十分钟的数据
-f 生成的数据文件名中包含文件创建的时间
-m 生成的数据文件的存放目录
这样就会生成一个 nmon 文件,并每十秒更新一次,直到十分钟后7、导入采集到的硬件数据
8、导出的文件
9、解压下图压缩包,使用excel打开分析工具 nmon analyser.xlsm
10、安装wps
11、点击打开
12、注意启用宏
13、导入采集的数据
14、导后的数据显示如下
15、分析和理解性能参数
分析性能测试
AAA文件
一:CPU信息
SYS_SUMM图表:
1.折线图中蓝线为cpu占有率变化情况;粉线为磁盘IO的变化情况;
2.下面表各种左边的位磁盘的总体数据,包括如下几个:
Avg tps during an interval:每个间隔时间内,平均每秒IO数,也可以理解为提交处理的次数
Max tps during an interval:每个间隔时间内,每秒最大IO次数;
Max tps interval time:最大传送次数出现的时间点;
Total number of Mbytes read:整个监控时间内读的字节数;
Total number of Mbytes written:整个监控时间内写的字节数;
Read/Write Ratio:读写比率;
3.右边的为CPU的总体数据,可以获取如下信息;
cpu被User/Sys/Wait所占百分比;
cpu整体平均空闲率/占有率,以及最大的空闲率/占有率;
cpu各项数据最大值和平均值的比率;
CPU_ALL页面:该页面可以看到如下图的CPU整体上在每个监控点的数据,包括User%、Sys%、Wait%、Idle%、CPU%以及CPUs(cpu个数)及对应图表
关键指标名称及含义:
User%
显示在用户模式下执行的程序所使用的 CPU 百分比;
Sys%
显示在内核模式下执行的程序所使用的 CPU 百分比;
Wait%
显示等待 IO 所花的时间百分比;
Idle%
显示 CPU 的空闲时间百分比;
CPU%
CPU总体占用情况;
Cpu使用率分为三部分,系统、用户、等待、闲置等,分别对应图中,cpu使用率100%的情况,如果橙色占大部分,说明系统进程本身占据大部分cpu资源,可考虑系统是否存在过多僵尸进程或者系统进程存在死循环等原因;如果蓝色占大部分,说明用户进程占用大量cpu资源,可考虑被压系统是否
压力过大,或者被压系统存在大量运算等消耗cpu资源的操作。
CPU_SUMM页面:该页面可以看到如下图的各个CPU在总体数据,User%、Sys%、Wait%、Idle%(闲置)以及对应图表
二:磁盘信息
DISK_SUMM图表:记录各个监控时间点的磁盘读写和IO次数
关键指标名称及含义:
Disk total kb/s Hostname
执行间隔时间列表;
Disk Read kb/s
每个磁盘执行采样数据;(磁盘设备的读速率)
Disk Write kb/s
每个磁盘执行采样数据;(磁盘设备的写速率)
IO/sec
每秒钟输出到物理磁盘的传输次数;
DISKBSIZE页面:详细记录了各监控时间点每个hdisk的磁盘块的大小,如我的服务器包括了sda、sda1、sda2、sda3
三:内存信息
MEM图表:该页面包含了如下图各监控时间点内存各方面的信息数据和图表
memtoatl:服务器总内存,单位M;
swaptotal:虚拟总内存;
memfree:剩余总内存;
swapfree:剩余虚拟内存;
四:网络信息
Net页面:该页面包含了每个监控时间点各个网络适配器的读写等数据传输速率(千字节/秒),如我的服务器包括适配器有eth0和lo
Total read 每秒接收到的千字节的数目,如图蓝色部分
Total write 每秒发送的千字节的数目,如图红色部分
网络=Total read-Total write
网络的指标一般要根据设备来确定,百兆网卡的意思是每秒能够传输的网络流量是100Mbps,即最大的下载速度是12.5MB/s,一般服务器是千兆网卡,即125MB/s



