2 ) 启动 kafkaIDEA 消费者 3 ) 进入 flume 根目录下,启动 flume $ bin/flume-ng agent -c conf/ -n a1 -f jobs/flume-kafka.conf 4 ) 向 /opt/module/data/flume.log 里追加数据,查看 kafka 消费者消费情况 $ echo hello >> /opt/module/data/flume.log 第 7 章 Kafka 面试题 7.1 面试问题 1.Kafka 中的 ISR(InSyncRepli) 、 OSR(OutSyncRepli) 、 AR(AllRepli) 代表什么? 2.Kafka 中的 HW 、 LEO 等分别代表什么? 3.Kafka 中是怎么体现消息顺序性的? 4.Kafka 中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么? 5.Kafka 生产者客户端的整体结构是什么样子的?使用了几个线程来处理?分别是什么? 6. “消费组中的消费者个数如果超过 topic 的分区,那么就会有消费者消费不到数据”这句 话是否正确? 7. 消费者提交消费位移时提交的是当前消费到的最新消息的 offset 还是 offset+1 ? 8. 有哪些情形会造成重复消费? 9. 那些情景会造成消息漏消费? 10. 当你使用 kafka-topics.sh 创建(删除)了一个 topic 之后, Kafka 背后会执行什么逻辑? 1 )会在 zookeeper 中的 /brokers/topics 节点下创建一个新的 topic 节点,如: /brokers/topics/first 2 )触发 Controller 的监听程序 3 ) kafka Controller 负责 topic 的创建工作,并更新 metadata cache 11.topic 的分区数可不可以增加?如果可以怎么增加?如果不可以,那又是为什么? 12.topic 的分区数可不可以减少?如果可以怎么减少?如果不可以,那又是为什么? 13.Kafka 有内部的 topic 吗?如果有是什么?有什么所用? 14.Kafka 分区分配的概念? 15. 简述 Kafka 的日志目录结构? 16. 如果我指定了一个 offset , Kafka Controller 怎么查找到对应的消息? 17. 聊一聊 Kafka Controller 的作用? 18.Kafka 中有那些地方需要选举?这些地方的选举策略又有哪些? 19. 失效副本是指什么?有那些应对措施? 20.Kafka 的哪些设计让它有如此高的性能?



