对代码、服务、服务器等资源进行数据监控,发现异常第一时间报警,通知开发处理,保证服务高可用。
为什么要做监控?实时看到服务运行状态,保证服务高可用。
都能监控哪些东西?● 代码审查(代码扫码、依赖分析、生成分析报告)
● pod监控(部署状态、可用节点数、pod的cpu、内存、网络)
● 服务内部监控(接口请求频次、未被拦截到的异常、JVM、HTTP、GRPC、POOL …)
● 数据库监控(Redis使用情况、TiDB使用情况、慢SQL、事务)
● 程序植入探针(非侵入式)
● promethues集成(侵入式、服务内部改造)
● 数据接入Grafana视图
● 日志接入elasticsearch + kibana可视化平台
● 企业微信、邮箱、短信告警



