栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 系统运维 > 运维 > Linux

运维避免系统故障心得

Linux 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

运维避免系统故障心得

俗话说,有人的地方就有江湖,江湖越老越怕死。对于运维来说,有机器的地方就有江湖。系统故障对于运维人员或者DBA来说,永远都是心中的痛。但避免故障的原则却是殊途同归,现列如下,与君共勉。

一、对决之前先练手

任何涉及生产变更的操作,都请事先测试。
佛说:每一种创伤,都是一种成熟。这便是运维人员的真实写照。

从某种意义上讲,运维是一门经验的学科、是一门试错的学科。没有做过的东西总是会给你不期而遇的毒打,涉及生产环境的操作,都要先在测试环境模拟,记录每一个操作步骤,再三模拟,然后再上生产。如果坚持要直接上生产,请保护案发现场,让变更有回头的机会。

二、小心使用杀伤力强的招式

杀伤力强的招式即破坏性的操作。

比如:对数据库而言:truncate table、delete table、drop database,这些语句执行起来轻松简单,但如果涉及误删,那么数据可恢复或者回滚,代价也是非常大的,每一次数据恢复,可能是业务几小时甚至几天的中断,期间的损失不可估量。

对 Linux 而言:rm -rf 所有当前及其子目录的所有数据都将被删除。经历过这种故障的人,大多会吸取教训,例如会给 rm 上个别名:

alias rm='rm -i'

同理,cp 和 mv 也可以有同样的选项:

alias cp='cp -i'alias mv='mv -i'

(-i --interactive 交互模式删除文件,删除文件前给出提示)

三、破案归档,复盘记录

好记性不如烂笔头,在一片混乱的问题分析、处理之后,事后需要复盘故障处理全流程,保留一份分析资料,总结并记录处理过程中的执行步骤以及解决途径,丰富知识库存储的同时也帮助自己和团队积累宝贵的处理经验。

四、抄录秘籍的同时注意真假
对于系统来说,备份是必须的操作,但备份的同时也需要验证备份的有效性。

人非圣贤,孰能无过?是机器总有意料之外崩溃的一天。怎么办?备份!!!
备份的学问很大,按照不同的维度可以分:冷备和热备、实时和非实时、物理和逻辑。7*24小时在线业务、数据库就需要有实时热备。但这样就高枕无忧了吗?
本人当时是新进公司,需要熟悉所有运维相关工作,在一次数据库巡检中发现原来的数据库备份不具有可使用性,原因:该备份是MySQL5.6版本,备份方式是定期tar打包,即直接拷贝tar包到同样环境的数据库下解压即用,这种方法适用公司MySQL5.0版本、存储引擎是myisam的数据库,但5.6版本的数据库存储引擎是innodb,所以原有的备份方式不合适,需要改为空闲时mysqldump备份或XtraBackup备份的方式。

故,备份完毕的同时尚须验证备份的有效性。最简单的验证方式就是找个空库来恢复。

五、接任和游历最容易出事

交接和休假最容易出故障的时间窗口

接手别人的工作要一而再、再而三的确认期间可能用到的变更方案。请教人并不见得就是能力不行的表现;休假前最好做完各种自己可以做完的事情。另外,准备一份涉及到的工作的文档,指明在什么情况下怎么做和哪些人联系;另外接手别人放假前交接的工作,小事“能拖则拖”,大事实在需要执行的,必须不厌其烦的跟原运维者确认各个操作细节,完全理清后方可执行。

六、善用情报系统

善其事必先利其器,运维人员赖于生存的工具是监控系统,即报警和监控。

报警可以让你及时知道系统出现了什么异常,以便及时跟进,把故障扼杀于摇篮;

监控可以让你了解系统的历史性能信息,以历为鉴可以知兴替嘛,早做优化。

报警和优化是一衣带水的好兄弟、相铺相成、互相促进。

七、多用武器

设置好命令提示

在操作之前、先理清你所在的是主库、备库?当前目录?哪个 schema?session?时间?

对于 Linux 而言,bash 环境的提醒可通过定义PS1环境变量来实现,比如将一些敏感目录、登陆用户名和主机信息等设置不同颜色,当操作中涉及到,这些信息会显示不同颜色,一目了然;

# PS1='[e[32;40m]-#[u t W]$'

八、对江湖永保敬畏之心

会计人员在从业之前、都有个职业操守的训练。同理,这也应该是运维人员进入行业首先需要具备的素养,对生产环境操作保持敬畏之心,比如:

对于 Oracle 而言、你可以跑一个 RDA(是oracle用来收集、分析数据库的工具) 巡检 DB 的健康状况;
对于 Linux 而言、是否有配置password aging、隔离外网、用户权限控制等。

九、大道即简

这有点佛禅的意境了,和Linux 的设计思想不谋而合。开发或者运维人员总会面临各种诱惑:新的系统架构、新的应用、新的云平台、功能更全面的集群、新版本的数据库…对于这些新技术,要学习,你可以在本地虚拟机环境部署、变更,怎么做都没问题,但想要在生产环境部署就还请三思而后行,不是每一项新技术或者新应用都适合公司的生产系统,系统架构设计也是简单实用即美,没必要搞到花里花俏的。比如能够使用操作系统自带命令,就不必要考虑其他要下载安装的软件;脚本就能完成的简单功能,就没有必要找一个功能丰富的软件来实现。

相对来说,Linux本身自带的命令或图形界面就比那些软件复杂的图形界面要简洁方便,也更实用。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/344464.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号