栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

kafka 难点

kafka 难点

参考文章
[[Kafka常见面试题](https://blog.csdn.net/qq_28900249/article/details/90346599)
[参考文章](https://www.cnblogs.com/juniorMa/articles/13936154.html)
重要考点
  1. kafka 为什么那么快
    • Cache Filesystem Cache PageCache缓存

    • 顺序写 由于现代的操作系统提供了预读和写技术,磁盘的顺序写大多数情况下比随机写内存还要快。

    • Zero-copy 零拷技术减少拷贝次数

传统传输文件流程
1. 硬盘—>内核buf—>用户buf—>socket相关缓冲区—>协议引擎

零拷贝
1. sendfile系统调用,文件数据被copy至内核缓冲区
2. 再从内核缓冲区copy至内核中socket相关的缓冲区
3. 最后再socket相关的缓冲区copy到协议引擎

总结
相较传统read/write方式,2.1版本内核引进的sendfile已经减少了内核缓冲区到user缓冲区,再由user缓冲区到socket相关缓冲区的文件copy,而在内核版本2.4之后,文件描述符结果被改变,sendfile实现了更简单的方式,再次减少了一次copy操作

* Batching of Messages 批量量处理。合并小的请求,然后以流的方式进行交互,直顶网络上限。

* Pull 拉模式 使用拉模式进行消息的获取消费,与消费端处理能力相符。
  1. 消息堆积
    1. 消费端宕机
      增加自动拉起脚本 告警
    2. 消费能力弱
      增强消费能力 异常处理
    3. 调节消费参数
      1. max.poll.interval.ms 每次poll消息处理时间调大
      2. max.poll.records 每次拉取消息条数减小
    4. 分片少
    5. 分片不均匀
      producer生产时设置key hash到分区均匀
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/422611.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号