(1)上线保障;
对系统技术指标进行检查;
对系统实现的业务功能点进行检查;
(2)巡检保障;
对常规技术指标进行检查,内存、磁盘和CPU使用率等信息
人工定时巡检业务功能点
(3)日常监控;
日志监控,
内存、磁盘和CPU使用率等信息进行监控
(4)应用工单支持;
实现工作台,根据业务人员ERP工单,技术人员的EQOPS工单,由开发提供手册,运维根据手册完成生产操作
(5)常规版本上线;
参与需求评审
开发设计评审
版本上线评审(开发:升级手册是否规范,架构设计是否合理,上下游系统是否就绪,是否存在影响核心系统的风险点、系统容量是否满足要求。测试:准入测试、针对性测试、功能性测试、性能测试、回归测试、联调测试、安全测试)
根据jira、ITSM软件发布流程完成版本上线工作
(6)事件处置;
牵头完成生产事件的处置,根据应急预案和应急测试完成的手册进行生产处置
例如:存储网关文件处理异常;实例僵死,初步排查原因、进行重启等
完成事件进展通报,事件总结,事件管理,事件转问题管理
(6)系统可用性排查
定期回顾系统存在的风险,可用性是否满足要求,是否需要进行优化,如优化架构,进行性能扩展
(7)应急演练;
根据事件定期回顾,完善应急预案,进行生产环境的应急演练,生产环境无法复现的,进行沙盘推演。



