实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

消息队列篇-kafka

大数据系统更新时间：2026-05-21 19:44:13 发布时间：1628天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

>>理论侧

书籍名称【Kafka权威指南】

链接：https://pan.baidu.com/s/11YqDDICWwQAHC4bKhwHMKg
提取码：vgz7

个人笔记:

Kafka权威指南

第 1 章初识Kafka
>>Apache Avro

>>Kaflca 的悄息通过主题进行分类。

>>先入先出的顺序读取。

>>MirrorMaker

使用场景
1 活动跟踪

2 传递消息

3 度量指标和日志记录

4 提交日志

5 流处理

常规配置
1> broker.id

标识,整数,默认0,唯一

2> port

3> zookeeper.connect

用于保存 broker 元数据的 Zookeeper 地址。

4> log .dirs

5> num.recovery.threads.perdata.dir

对于如下3种情况， Kafka 会使用可配置的钱程来处理日志片段

5.1 服务器正常启动，用于打开每个分区的日志片段

5.2服务器崩愤后重启，用于检查和截短每个分区的日志片段：

5.3服务器正常关闭，用于关闭日志片段。

6> auto.create.topics.enable

默认情况下， Kafka 会在如下几种情形下自动建主题

6.1 当一个生产者开始往主题写入消息时

6.2 当一个消费者开始从主题读取消息时

6.3 任意个客户端向主题发送元数据请求时。

主题的默认配置
1> num.partitions

参数指定了新创建的主题将包含多少个分区,默认1

2> log.retention.ms

Kafka 通常根据时间来决定数据可以被保留多久。默认使用 log. retentlon.hours 参数来配

置时间，默认值为 168 小时。

3>log.retention.bytes

4>log.segment.bytes

5>log.segment.ms

6>message.max.bytes

broker 通过设置message.max.bytes 参数来限制单个消息的大小，默认值是1MB

第 2 童安装 Kafka

第 3 章 Kafka 生产者一一向 Kafka 写入数据

Kafka 发送消息的主要步骤:

Kafka 生产者有3个必选的属性
1 bootstap.severs:该属性指定 broker 的地址清单。

2 key.serializer:默认提供ByteArraySerializer/StringSerializer/IntegerSerializer

3 value.Serializer

发送消息
1 发送并忘记

2 同步发送

3 异步发送

生产者的配置

序号

配置名称

配置说明

配置取值

1

acks

参数指定了必须要有多少个分区副本收到消息

0/1/all

2

buffer.memory

该参数用来设置生产者内存缓冲区的大小，生产者用它缓冲要发送到服务器的消息

3

compression.type

默认情况下，消息发送时不会被压缩

snappy/gzip/lz4

4

retries

5

batch.size

6

linger.ms

7

client.id

8

max.in.flight.requests.per.connection

指定了生产者在收到服务器晌应之前可以发送多少个消息

9

timeout.ms/request.timeout.ms/ metadata.fetch.timeout.ms

10

max.block.ms

11

max.request.size

12

receive.buffer.bytes/send.buffer.bytes

>>键有两个用途：

可以作为消息的附加信息，也可以用来决定消息该被写到主题的哪个分区

>>不要让消费者的数量超过主题分区的数量，多余的消费者只会被闲置

>>Confluent Schema Registry

第 4 章 Kafka 消费者一一从 Kafka读取数据
>>Partitioner

>>分区的所有权从一个消费者转移到另一个消费者，这样的行为被称为再均衡。

>>subscribe

>>一旦消费者订阅了主题，轮询就会处理所有的细节，包括群组协调、分区再均衡、发送心跳和获取数据，

消费者配置

序号

配置名称

配置说明

取值

1

fetch.min.bytes

该属性指定了消费者’从服务器获取记录的最小字节数。

2

fetch.max.wait.ms

默认500ms

3

max.partition.fetch.bytes

该属性指定了服务器从每个分区里返回给消费者的最大字节数。

它的默认值是 lMB

4

session.timeout.ms

默认:3秒

5

auto.offset.reset

该属性指定了消费者在读取一个没有偏移量的分区或者偏移量无效的情况下（因消费者长

时间失效，包含偏移量的记录已经过时井被删除）该作何处理

默认:latest

6

enable.auto.commit

该属性指定了消费者是否自动提交偏移量，

默认值是 true

7

partition.assignment.strategy

Range/RoundRobin

8

client.id

9

max.poll.records

10

receive.buffer.bytes

11

send.buffer.bytes

退出
consumer.wakeup()是消费者唯一一个可以从其他线程里安全调用的方法。

第 5 章深入Kafka
“脑裂”是指两个节点同时认为自己是当前的控制器。

Kafka 使用零复制技术向客户端发送消息

第 6 章可靠的数据传递

消费者的可靠性配置
1>group.ld

2>auto.offset.reset

3>enable.auto.commit

4>auto.commit.interval.ms

第 7 章构建数据管道

第 8 章跨集群数据镜像
Kafka 内置的跨集群复制工具叫作 MirrorMaker

跨集群镜像使用场景
区域集群和中心集群
冗余
云迁移

双活架构

生产者进行调优，可以使用下列参数。
1>max.in.flight.requests.per.connection

2>linger.ms

3>batch.size

配置用于提升消费者的吞吐量:
1>range

2>fetch.max.bytes

3>fetch.min.bytes

4>fetch.max.wait

第 9 章管理 Kafka

第 1 0 章监控 Kafka

第 1 1 章流式处理

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/633043.html

上一篇 Flume：搭建配置以及 source读取在netcat、http，sink 落实在本地、HDFS

下一篇砂之船独创“超级奥莱”商业模式，开创了奥莱行业先河

大数据系统相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号