著名的CAP理论指出,一个分布式系统不可能同时满足 C(一致性)、A(可用性)、P(容错性)。
由于分布容错性P在分布式系统中是必须要保存的,因此我们只能在A和C之间进行权衡。
- Zookeeper 保证的是CP;
- Eureka 保证的是AP;
当注册中心查询服务列表时,我们可以容忍注册中心返回的是几分钟以前的注册信息,但不能接受服务直接down掉不可用。也就是说,服务注册功能对可用性的要求要高于一致性。但是 Zookeeper 会出现这样一种情况,当 master 节点因为网络故障与其它节点失去联系时,剩余节点会重新进行 leader 选举。问题在于,选举 leader 的时间太长,30~120s,且选举期间整个 Zookeeper 集群都是不可用的,这就导致在选举期间注册服务瘫痪。在云部署的环境下,因为网络问题使得Zookeeper 集群失去 master 节点是大概率会发生的事件,虽然服务最终能够恢复,但是漫长的选举时间导致的注册长期不可用是不能容忍的。
Eureka 保证的是APEureka看明白了这一点,因此在设计时就优先保证可用性。Eureka 各个节点都是平等的,几个节点挂掉不会影响正常节点的工作,剩余的节点依然可以提供注册和查询服务。而 Eureka 的客户端在向某个Eureka 注册时,如果发现连接失败,则会自动切换至其他节点,只要有一台 Eureka 还在,就能保住注册服务的可用性,只不过查到的信息可能不是最新的,除此之外,Eureka 还有一种自我保护机制,如果15分钟内超过85%的节点都没有正常的心跳,那么 Eureka 就认为客户端与注册中心出现了网络故障,此时会出现以下几种情况:
1、Eureka 不在从注册列表中移除因为长时间没收到心跳而应该过期的服务
2、Eureka 仍然能够接受新服务的注册和查询请求,但是不会同步到其它节点上(即保证当前节点依然可用)
3、当网络稳定时,当前实例新的注册信息会被同步到其它节点中
因此,Eureka 可以很好的应对因网络故障导致部分节点失去联系的情况,而不会像Zookeeper 那样整个注册服务瘫痪
参考目录狂神
https://www.bilibili.com/video/BV1jJ411S7xr?p=9



