1、普通集群模式,主从模式
有一个master节点,其他都是slave节点,master响应客户端的请求,并存储消息;slave只同步master节点的消息(同步模式是:同步同步或者异步同步),也会响应部分客户端读请求。
master挂了的话,slave节点不会转变为master,也就是会导致集群不可用。
2、Dledger集群模式
Dledger集群是rocketmq在4.5版本之后引入的高可用集群模式,采用Raft算法来随机选举master节点,master节点在挂掉不可用的时候,slave节点会根据Raft算法选举出新的master节点。
Dledger主要实现了三个方面的技术点:
1、接管broker的commitLog消息存储;2、从集群中选举出master节点;完成master节点往slave节点的消息同步。
Dledger集群模式把master叫成leader,slave叫成follower,还有一个叫candidate候选人,在选举leader的时候会出现;leader响应所以客户端的请求,follower只响应leader和candidate请求,客户端如果访问的是follower,也会把请求全部转发给leader请求。
Raft协议中,会将时间分为任意时间长度的时间片段,叫做term。每个term都有一个全局唯一,连续递增的编号作为标识。每个节点都会存储当前term编号,每个term时间片段里都会进行新的选举,每次选举都可能会是新的leader产生,每个产生的leader会在当前term时间片段保持leader状态,保证集群中有一个leader。当选举的时候会用term编号进行比较,如果发现自己的编号小于别的节点的,会将编号修改成那个大的编号,此时该节点会把自己改成follower(因为term编号小了),如果比别人的term编号大,则拒绝给它投票。如果当前term时间片段选举不出leader,会等到下次term时间片段进行重新选举,这种term时间片段方式避免了zookeeper的脑裂问题。
Raft算法选举过程,以三个节点集群为例:
1、当集群启动的时候,三个节点此时状态都是follower,当到达term时间片段(term编号为1)时,所有follower会转成candidate候选人去拉选票,发起投票后,三个节点都会给自己投一票,这样三个节点的term编号1,这种情况选不出leader。
2、当一轮选举不出leader时,三个节点会进入随机休眠,每个节点休眠时间不一样,假如A休眠1秒,B休眠2秒,C休眠3秒;
3、1秒后A收到集群的timeout信号醒来,会把自己的term编号加1票,变成2。2秒后,B也醒来,发现A的term编号已经是2,比自己大,会承认A是leader,然后把自己的term编号也更新为2。根据选举票数超过半数以上通过后,A就会成为leader。
4、3秒后C醒来也发现A的term编号比自己的大,也会承认A是leader,更改自己的term编号为2。这样B和C都会从candidate状态变成follower状态。
5、A变成leader后,会不断对B和C两个节点发送心跳,如果A挂了导致B和C收不到心跳,则B和C会重新变成candidate状态发起选举。



