Kafka工作原理深度解析：角色、分区与消息传递

Kafka

1星需积分: 50 120 浏览量更新于2024-09-08 收藏 145KB DOCX 举报

身份认证购VIP最低享 7 折!

30元优惠券

"Kafka工作原理详解" Kafka是一个分布式流处理平台，用于构建实时数据管道和流应用。它设计为高吞吐量、低延迟的消息系统，广泛应用于大数据处理和实时分析。以下是Kafka核心组件和工作原理的详细说明： 1. **Kafka的角色**： - **Broker**：Kafka集群的节点，负责存储和转发消息。多个broker组成一个集群，提供冗余和容错能力。 - **Topic**：逻辑上的分类或主题，用户可以发布消息到特定的topic。 - **Partition**：topic的物理细分，用于水平扩展和并行处理。每个partition是一个有序的队列，消息在partition内按照offset顺序添加。 - **Offset**：在partition内的唯一标识符，表示消息的顺序。offset是一个递增的整数，用于跟踪消息的位置。 - **Producer**：消息的生产者，负责创建和发送消息到Kafka broker。 - **Consumer**：消息的消费者，负责从Kafka broker读取和处理消息。 - **ConsumerGroup (CG)**：消费者组织成组，每个topic的消息可以被多个CG消费，且CG内部的消息消费是幂等的。 2. **Partition策略**： - **KeyHash算法**：根据消息的关键字进行哈希，确保具有相同关键字的消息总是被分发到相同的partition，适用于保持消息顺序和相关性。 - **RoundRobin算法**：轮流分配消息到不同的partition，提供负载均衡，但不保证消息的顺序。 3. **消息系统类型**： - **广播（Broadcasting）**：所有消费者都能接收到消息，适用于需要全集群同步的情况。 - **订阅发布（Publish/Subscribe）**：只有订阅了特定topic的消费者才能接收到消息，适用于一对多的通信模式。 4. **Kafka与Zookeeper的关系**： - Kafka早期版本依赖Zookeeper存储元数据和协调集群，但现在推荐使用Kafka自己的Controller角色来管理元数据，减少对Zookeeper的依赖。不过，一些旧版本或配置可能仍然使用Zookeeper。 5. **ConsumerGroup的工作方式**： - 每个CG内部的消费者通过协调机制确保消息的均衡消费，不会重复消费。 - CG下的每个consumer只消费partition的一个子集，实现负载均衡和并行处理。 - 如果一个consumer离开CG，其分配的partition会被其他成员接管，确保无数据丢失。 Kafka通过这些机制提供了可靠、高效的消息传递服务，支持大规模实时数据处理和流应用。了解和掌握这些核心概念对于有效地使用和部署Kafka至关重要。

资源详情

资源推荐

Kafka 工作原理详解

1.Kafka 有哪些角色？

2.Partition 的作用是什么？

3.Oset 的作用是什么？

4.消息系统有哪两类？

5.什么是 topic 消息广播和单播？

6.Kafka 的元数据和 Topic 是否都存储在 zookeeper？

Kafka 系统的角色

 Broker ：一台 kafka 服务器就是一个 broker。一个集群由多个 broker 组成。一

个 broker 可以容纳多个 topic

 topic：可以理解为一个 MQ 消息队列的名字

 Partition：为了实现扩展性，一个非常大的 topic 可以分布到多个broker（即服

务器）上，一个 topic 可以分为多个 partition，每个 partition 是一个有序的队列。

partition 中的每条消息都会被分配一个有序的 id（oset）。kafka 只保证按一

个 partition 中的顺序将消息发给 consumer，不保证一个 topic 的整体（多个

partition 间）的顺序。也就是说，一个 topic 在集群中可以有多个 partition，那

么分区的策略是什么？(消息发送到哪个分区上，有两种基本的策略，一是采用

Key Hash 算法，一是采用 Round Robin 算法)



 Oset：kafka 的存储文件都是按照 oset.kafka 来命名，用 oset 做名字的好

处是方便查找。例如你想找位于 2049 的位置，只要找到 2048.kafka 的文件即可。

当然 the &rst oset 就是 00000000000.kafka

 Producer ：消息生产者，就是向 kafka broker 发消息的客户端。

 Consumer ：消息消费者，向 kafka broker 取消息的客户端

下载后可阅读完整内容，剩余4页未读，立即下载

guofeng314

粉丝: 3
资源: 14

Kafka工作原理深度解析：角色、分区与消息传递

kafaka文档.pdf

kafka细心原理与实战

深入理解Kafka：核心设计与实践原理_朱忠华著_带目录.rar

kafka原理详解图文

kafka参数配置详解

@KafkaListener使用详解

kafka配置文件详解

spring boot kafka配置文件详解

Kafka的工作原理

clickhouse Kafka引擎 原理

[Logstash-input-kafka] 使用详解

kafka底层原理面试题

kafka工作流程分析

flink 读取kafka 原理

ctg-kafka基本原理

大致说一下kafka的原理

@KafkaListener详解与使用

kafka消息队列原理

kafka19092相关技术博客

kafka原理剖析及实战演练

最新资源

clickhouse Kafka引擎原理