栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

如何保证MQ消息队列的高可用

如何保证MQ消息队列的高可用

RabbitMQ

对于RabbitMQ,有三种模式,分别是单机模式,普通集群模式、镜像集群模式,其中镜像集群模式可以实现高可用

单机模式

一台RabbitMQ实例,想想都不可能保证高可用,一般在开发中也不会使用单机模式

普通集群模式

有多台RabbitMQ实例,每个都放在单独的机器上,生产者生产出的queue只放在其中一个RabbitMQ实例上,其他实例上存放的是queue元数据(元数据存放一些RabbitMQ的配置信息,可以通过元数据找到拥有实际数据的queue),如果消费者拉取的正好是放有queue实际数据的RabbitMQ,就会直接拉取到,如果拉取的是另外的RabbitMQ,会通过queue元数据定位到存放queue实际数据的RabbitMQ,从那里拉取数据再发给消费者。
显然这种模式也不能保证高可用,如果放有实际数据的RabbitMQ宕机,别的RabbitMQ也找不到queue实际数据了,只有等这台RabbitMQ恢复才能拉取数据,如果没有开启消息持久化,甚至数据也会没了,这种模式仅仅被用来提高吞吐量

镜像集群模式

和普通集群模式类似,也是多台RabbitMQ实例。与之不同的地方在于,每台RabbitMQ实例上都有完整的queue镜像,首先生产者会生产出queue放到一台RabbitMQ上,其他的RabbitMQ会同步这台RabbitMQ上的queue,保证每台RabbitMQ上的queue都是一样的,都包含着实际数据,如果一台RabbitMQ宕机,没有关系,别的RabbitMQ上也有queue,保证了RabbitMQ的可用性,开启这个模式只需在控制台添加镜像集群模式策略即可
优点:一台RabbitMQ宕机,消费者还可以去别的RabbitMQ上拉消息
缺点:
①性能开销大,因为消息需要同步,对网络的压力比较大
②没有扩展性,如果一个queue负载很大,如果添加RabbitMQ,这个RabbitMQ上也会同步queue的全部数据,也会有很大的负载,不能线性地扩展queue

Kafka

在Kafka 0.8之前是没有HA机制的,如果哪个broker宕机了,那么这个broker上的partition也就没有了,没有高可用
例如,生产者生产出的topic被分成3个partition,每个partition相当于topic的1/3,被分给3个broker,如果第二个broker宕机了,那么这1/3的partition也就没了

Kafka 0.8之后,就出现了HA机制,是通过replica副本来完成的,对于每个partition,会生成多个replica副本,并分给所有的broker,对于同一个partition的多个replica,会选举出一个leader,其余的为follower,生产和消费都在leader上完成,在写的时候,leader会把数据同步给其余的follower,读的时候只需要在leader上读即可
为什么只能在leader上读写呢?因为假如你还在follower上面读写的话,就要考虑数据一致性的问题了,可能会出现数据重复,丢失,混乱的问题,Kafka 会均匀地将一个 partition 的所有replica分布在不同的broker上,这样才可以提高容错性。

这样以来,有高可用性了,如果一个broker宕机,其他broker上面都有这个partition的replica副本,如果宕机的是某个partition的leader,此时会从其他的follower中选举出一个leader,读写这个leader即可,这就是高可用。
生产的时候,生产者就往leader中写数据,然后leader就把这个数据放到本地磁盘中,其他follower会从leader中pull数据,当所有follower都同步完成之后,就会发送ack给leader,leader确认收到ack之后就会返回给生产者成功写入的消息
消费的时候,只会从leader上读数据,消费者只能在这个消息被follower返回ack之后才能读到

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/748197.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号