随着信息化发展,云计算、高性能集群等应用规模不断扩大、机房设备数量不断增加。传统的厂商监控工具无法满足运维人员日常工作需要,反之会给运维人员增加负担,传统的设备厂商监控工具有管网络设备的,有管机房环境的,有管主机服务器的,有管数据库、中间件的等。各管一滩、各自为政,这样让维护业务系统成为一个难题,一旦某个业务运行缓慢甚至中断时,无法及时判断问题根源,所以需要建立一套实时、统一、集中有效的智能运维监控管理平台。
2.需求分析 2.1 pc端需求-
用户登录:登录监控平台网页
-
实时监控:可以通过网页显示设备实时状态
-
配置设备:添加或者删除设备
-
断开连接:可以手动断开设备连接释放资源
-
设备状态变更推送:检测设备状态并且可以实时更改
-
发送心跳包:每隔30s实时发送一个心跳包
-
发送异常信号:当设备出现异常及时通知服务器
-
发送设备状态变化:当设备状态发生变化通知服务器
-
更改状态:接受服务器端指令改变状态
-
支持用户并发访问
-
支持多个集群
-
每个集群节点扩展至几千个并能保证响应速度不变
-
提供外部访问接口,实现手机应用的调用
根据需求设计分析,我们在测试阶段可以通过进程模仿机器集群,tcp服务器接受client的tcp连接,同时tcp服务器同时作为websocket服务器的客户端,向websocket服务器发送设备信息,最终传入web网页供用户观看。
3.1 概念图 3.2 开发视图 3.3 核心类图 3.4 时序图- 开发环境与工具
-
开发语言: C++、python
-
代码管理与版本控制:gitee
-
开发工具:visual studio 2019 、pycharm
-
网络库与框架选择:libhv(TCPServer)、Django(websocket)、vue(web)、redis(数据库)、nginx(proxy)



