Apache Kafka 是一个开源分布式事件流平台,被数千家公司用于高性能数据管道、流分析、数据集成和关键任务应用程序。
1. kafka 的核心能力
高吞吐量: 使用延迟低至 2 毫秒的机器集群以网络有限的吞吐量传递消息。
可扩展: 将生产集群扩展到一千个代理、每天数万亿条消息、PB 级数据、数十万个分区。弹性扩展和收缩存储和处理。
永久存储: 将数据流安全地存储在分布式、持久、容错的集群中。
高可用性: 在可用区域上有效地扩展集群或跨地理区域连接单独的集群。
2. kafka 的生态系统
内置流处理: 使用事件时间和精确一次处理,通过连接、聚合、过滤器、转换等处理事件流。
连接到几乎任何东西: Kafka 开箱即用的 Connect 接口与数百个事件源和事件接收器集成,包括 Postgres、JMS、Elasticsearch、AWS S3 等。
客户端库: 使用大量编程语言读取、写入和处理事件流。
大型生态系统开源工具: 大型开源工具生态系统:利用大量社区驱动的工具。
3. kafka 的信任和易用性
关键任务: 通过保证排序、零消息丢失和高效的一次性处理来支持任务关键型用例。
被成千上万的组织信任: 从互联网巨头到汽车制造商再到证券交易所,成千上万的组织都在使用 Kafka。超过 500 万次独特的终身下载。
庞大的用户社区: Kafka 是 Apache 软件基金会五个最活跃的项目之一,在世界各地有数百场聚会。
丰富的在线资源: 丰富的文档、在线培训、指导教程、视频、示例项目、Stack Overflow 等。
以上信息来自官网译文,仅供参考



