Kafka集群构建详解：Producer-Consumer-Broker与Partition调度

1星需积分: 12 46 浏览量更新于2024-09-09 收藏 99KB DOCX 举报

Kafka集群搭建与使用是一篇关于Apache Kafka, 一种高性能分布式消息传递系统的文章。Kafka基于Scala编程语言构建，它的设计理念虽然借鉴了Java Message Service (JMS) 规范，但并非完全遵循，而是引入了独特设计以适应高吞吐量和实时处理的需求。文章的核心知识点包括： 1. **Kafka简介**： Kafka是一种消息系统，专注于处理大量实时数据流。它提供发布订阅模型，允许生产者（Producer）将消息发布到特定的主题（Topic），而消费者（Consumer）则订阅这些主题并处理接收到的消息。Kafka集群由多个代理（Broker）组成，它们负责存储和分发消息。 2. **基本概念**： - **Topic**：消息的分类容器，所有与同一主题相关的消息都在同一Topic下。 - **Producer**：发送消息到Kafka的节点，负责将数据发布到指定的Topic。 - **Consumer**：接收和处理Topic中的消息，从Kafka集群获取数据。 - **Broker**：Kafka集群中的节点，负责存储分区（Partition）的日志（commitlog）。 3. **分区与日志**： - **Partition**：分区是Topic内部的消息队列，每个分区有自己的顺序和唯一的offset（消息的标记，用于跟踪消息位置）。 - **Commit Log**：分区的持久化存储，消息按顺序写入，并通过offset进行索引。 4. **通信机制**： Kafka的服务端（Broker）和客户端（Producer/Consumer）之间的通信采用TCP协议，Kafka提供了Java客户端，同时也支持其他语言的客户端实现。 5. **架构图解**：文章还配有一张图，展示了生产者如何将消息发送到Kafka集群，然后被消费者消费的流程。通过本文，读者可以深入了解Kafka的体系结构、工作原理以及如何在实际项目中搭建和管理Kafka集群，这对于理解和使用这种流行的消息队列系统至关重要。掌握这些概念有助于优化分布式应用的数据处理性能和可靠性。

之为 offset，用来唯一标示某个分区中的 message。

提示：每个 partition，都对应一个 commit-log。一个 partition 中

的 message 的 o'set 都是唯一的，但是不同的 partition 中的

message 的 o'set 可能是相同的。

kafka 集群，在配置的时间范围内，维护所有的由 producer 生成的消息，而

不管这些消息有没有被消费。例如日志保留( log retention )时间被设置为 2

天。kafka 会维护最近 2 天生产的所有消息，而 2 天前的消息会被丢弃。

kafka 的性能与保留的数据量的大小没有关系，因此保存大量的数据(日志信

息)不会有什么影响。

每个 consumer 是基于自己在 commit log 中的消费进度(o'set)来进行工作

的。在 kafka 中，o'set 由 consumer 来维护：一般情况下我们按照顺序逐条

消费 commit log 中的消息，当然我可以通过指定 o'set 来重复消费某些消息，

或者跳过某些消息。

这意味 kafka 中的 consumer 对集群的影响是非常小的，添加一个或者减少一

个 consumer，对于集群或者其他 consumer 来说，都是没有影响的，因此每

个 consumer 维护各自的 o'set。

对 log 进行分区（partitioned），有以下目的。首先，当 log 文件大小超过系

统文件系统的限制时，可以自动拆分。每个 partition 对应的 log 都受到所在机

器的文件系统大小的限制，但是一个 Topic 中是可以有很多分区的，因此可以

处理任意数量的数据。另一个方面，是为了提高并行度。

Distribution

log 的 partitions 分布在 kafka 集群中不同的 broker 上，每个 broker 可以请

剩余11页未读，继续阅读

lnn_ning

粉丝: 0
资源: 11

Kafka集群构建详解：Producer-Consumer-Broker与Partition调度

搭建kafka集群详细教程

kafka消息队列集群安装说明

kafka集群搭建和使用Java写kafka生产者消费者

kafka集群搭建

Kafka集群搭建1

kafka集群搭建文档

Kafka集群搭建与部署教程

Apache Kafka集群搭建与应用详解

Kafka集群搭建与管理：环境配置与Kafka Eagle安装

Kafka集群搭建与管理：从入门到精通，轻松构建高可用、高性能的Kafka集群

最新资源