栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

kafka核心知识简略版整理【完成度25%,补充ing】

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

kafka核心知识简略版整理【完成度25%,补充ing】

1.是什么?

Kafka是一个分布式、支持分区、多副本的,基于zookeeper协调的分布式消息中间件

2 使用场景

核心的场景、原因有 3 个:解耦、异步、削峰。

具体:

  • 日志收集
  • 消息系统:解耦和生产者和消费者、缓存消息等。
  • 用户活动跟踪:用户的各种活动,如浏览、搜索、点击等活动,发布到kafka的topic中,然后订阅者通过订阅这些topic来做实时的监控分析,或者装载到hadoop、数据仓库中做离线分析和挖掘。
  • 运营指标:包括收集各种分布式应用的数据,生产各种操作的集中反馈,比如报警和报告。
3.基本概念术语
名称解释
Broker一个Kafka节点即是一个broker,一个或者多个Broker可以组成一个Kafka集群
TopicKafka根据topic对消息进行归类,发布到Kafka集群的每条消息都需要指定一个topic
Producer消息生产者,向Broker发送消息的客户端
Consumer消息消费者,从Broker读取消息的客户端
ConsumerGroup每个Consumer属于一个特定的Consumer Group,一条消息可以被多个不同的Consumer Group消费,但是一个Consumer Group中只能有一个Consumer能够消费该消息
Partition物理上的概念,一个topic可以分为多个partition,每个partition内部消息是有序的
offsetpartition中的消息的唯一的编号
ControllerKafka集群中会有一个或者多个broker,其中有一个broker会被选举为控制器(Kafka Controller),它负责管理整个集群中所有分区和副本的状态。
leader Broker这个broker节点负责partition的所有读写请求,其它broker只接收leader同步来的数据
  • replicas 表示某个partition在哪几个broker上存在备份。不管这个几点是不是”leader“,甚至这个节点挂了,也会列出。
  • isr 是replicas的一个子集,它只列出当前还存活着的,并且已同步备份了该partition的节点。

producer通过网络发送消息到Kafka集群,然后consumer来进行消费。

服务端(brokers)和客户端(producer、consumer)之间通信通过TCP协议来完成。

4.术语详解

Topic是Kafka对消息进行分类的一个概念,同类消息发送到同一个Topic下面。

对于每一个Topic,下面可以有多个分区(Partition)日志文件:

Partition是有序的message序列,每个partition,都对应一个commit log文件。

message按顺序添加到一个叫做commit log的文件中。

每个partition中的消息都有一个唯一的编号,称之为offset,用来唯一标示某个分区中的message。 +

kafka一般不会删除消息,不管这些消息有没有被消费。只会根据配置的日志保留时间(log.retention.hours)确认消息多久被删除,默认保留最近一周的日志消息。

kafka中,消费offset由consumer自己来维护;一般情况下我们按照顺序逐条消费commit log中的消息

5.为什么要对Topic下数据进行分区存储?

1、commit log文件会受到所在机器的文件系统大小的限制,分区之后可以将不同的分区放在不同的机器上,相当于对数据做了分布式存储,理论上一个topic可以处理任意数量的数据。

2、为了提高并行度。

7. Kafka服务端概念

查看下topic的情况

输入命令: bin/kafka-topics.sh --describe --zookeeper 192.168.65.60:2181 --topic test1 ,

然后会显示几个概念

  • leader的那个broker节点负责partition的所有读写请求。
  • replicas 表示某个partition在哪几个broker上存在备份。不管这个几点是不是”leader“,甚至这个节点挂了,也会列出。
  • isr 是replicas的一个子集,它只列出当前还存活着的,并且已同步备份了该partition的节点。
6.消息消费 6.1 消费示意图

上图说明:由2个broker组成的kafka集群,某个主题总共有4个partition(P0-P3),分别位于不同的broker上。这个集群由2个Consumer Group消费, A有2个consumer instances ,B有4个。

通常一个topic会有几个consumer group,每个consumer group都是一个逻辑上的订阅者( logical subscriber )。每个consumer group由多个consumer instance组成,从而达到可扩展和容灾的功能。

6.2 消费顺序

一个partition同一个时刻在一个consumer group中只能有一个consumer instance在消费,从而保证消费顺序。消费者数量大于分区数,将会有消费者分不到消费的机会。

7.Kafka核心总控制器Controller
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/877493.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号