kafka留存策略包括 删除和压缩两种删除: 根据时间和大小两个方式进行删除 大小是整个partition日志文件的大小超过的会从老到新依次删除 时间指日志文件中的最大时间戳而非文件的最后修改时间压缩: 相同key的value只保存一个 压缩过的是clean 未压缩的dirty 压缩之后的偏移量不连续 未压缩时连续
扩展问题:
聊一聊你对Kafka的Log Compaction的理解**
聊一聊你对Kafka底层存储的理解(页缓存、内核层、块层、设备层)
聊一聊Kafka的延时操作的原理
聊一聊Kafka控制器的作用
消费再均衡的原理是什么?(提示:消费者协调器和消费组协调器)



