(1)Kafka设计架构综述
(2)Kafka中生产者工作机制详解
(3)Kafka 消费者工作机制详解
(4)Kafka高效读写原理、选举过程和事务实现
1.Kafka高效读取数据(1)顺序写入磁盘 kafka的broker收到producer数据时,以log文件尾部追加方式顺序写入。顺序写入大于随机写入效率在于,省去了大量磁头寻址时间。 一 次完整的输入输出(IO)操作的时间=磁盘轴旋转时间(旋转延迟)+磁盘臂移动时间(寻道时间)+数据传输时间 。三者所需时间的平均经验值为: 0.004秒、0.008秒和0.0005秒。所以, 一次完整的IO时间的经验值是0.0125秒,即1/80秒。 因为磁盘的盘片可分为多个扇区,顺序写只需要磁头随着磁盘顺序旋转即可,而随机 写可能需要寻道,还要旋转道跨越多个扇区。 (2)零复制技术 Kafka利用OS内核功能,减少了数据拷贝的次数,避免了CPU进行不必要的数据拷贝。 参考: 掘金 2.Zookeeper实现Kafka leader选举
(1)Controller作用和Controller选举 首先Kafka集群中有一个broker会被选举为Controller, 负责管理broker的上下线,所有 topic的分区副本分配和 leader选举等工作。 在kafka集群启动的时候,会在ZK中创建一个临时节点(EPHEMERAL)/controller,在每个Broker启动的时候,都会先去访问ZK中的这个节点,如果不存在Broker就会则创建这个节点,先到先得称为Controller, 其它Broker当访问这个节点的时候,如果读取到brokerid不等于-1,那么说明Controller已经被选举出来了。 Controller选举有三个场景
- 集群首次启动:首次启动时未选举Controller,Broker都向ZK进行注册然后由ZK 调用elect方法选举
- Controller节点宕机:ZK再次调用elect方法选举
- ZK中节点数据变更:如果当前Broker之前就是Controller,则卸任重新尝试选举。如果当前Broker不是Controller,则直接向ZK竞选。
(1)事务作用 事务可以保证 Kafka 在 Exactly once 语义的基 础上,生产和消费可以跨分区和会话,要么全部成功,要么全部失败。 At Least once + 幂等性



