服务器架构设计中,你经常会听到容错、灾备、高可用这三个词,但是这三个词常常会被用错,即使是专业人员也会如此。
容错Fault Tolerance,能容忍一定的失败,部分组件失败,不会中断系统的运行,仍然能对外提供服务。
比如早期的大型飞机有4个引擎,坏了一个飞机仍然还能飞行,不会坠毁。
高可用我们通常听到某个系统可用性 99.9%、99.99% , 系统可用性计算方式:
系统可用性 = 系统宕机时间/一年的时间 * 100%
由于系统会存在升级错误、系统漏洞等,谁也无法保证系统 100% 可用,只能说保证几个 9 的问题。系统一旦问题如何能够快速恢复,是提高可用性的关键。
汽车后面的备胎,就是很好的例子,一旦汽车抛锚,利用有限的工具能快速让备胎顶上。
灾备也叫作灾难恢复(Disaster Recovery),一旦系统发生灾难性的毁灭时,如何保证你的业务通常是你的数据库不被摧毁,重新部署系统后,你的业务还能正常运行。
比如,战斗机坠毁的时候,飞机上的弹射装置和降落伞能够保证飞行员的安全。
(飞行员是空军的核心,培养一个飞行员可是非常不容易的)
总结容错:系统能容忍局部错误,继续对外提供服务。
高可用:系统一旦发生致命性错误,如何缩短宕机时间快速恢复
灾备:通常说的是数据,数据库宕机或物理餐盘损坏,如何保证数据不丢
如果觉得还不错的话,关注、分享、在看(关注不失联~), 原创不易,且看且珍惜~



