Kafka：分布式消息服务详解

需积分: 14 73 浏览量更新于2024-07-21 收藏 668KB PDF 举报

"Kafka简介" Kafka是一种分布式流处理平台，设计目标是提供高吞吐量、低延迟的消息传递服务。它的核心特性包括轻量级、分布式、可分区和基于备份，使其成为处理大规模实时数据的理想选择。不同于传统的消息队列（如JMS），Kafka具有独特的设计和实现方式。 Kafka的核心概念包括生产者（Producer）、消费者（Consumer）和主题（Topic）。生产者负责发布消息到特定的主题，而消费者则订阅并消费这些主题中的消息。每个主题可以进一步划分为多个分区（Partition），每个分区是有序的且不可变的日志，由一系列按顺序附加的消息组成，这些消息的唯一标识是它们的偏移量（Offset）。 Kafka集群由多个服务器（Broker）组成，它们共同管理主题和分区的数据。集群的协调工作依赖于Zookeeper，用于维护元数据信息和确保系统的高可用性。客户端（Producer和Consumer）与Broker之间通过TCP协议进行通信，采用高效的轻量级消息协议。每个分区在存储层面上表现为一个追加的日志文件，消息一旦写入就不能被修改或删除，只能向后追加。为了保证消息持久性和容错性，Kafka会在多个Broker之间复制分区，形成备份。消息的消费是基于offset进行的，消费者会记住每个分区的消费位置，以便下次从上次的位置继续消费。与传统消息队列系统如ActiveMQ不同，Kafka不会在消息被消费后立即删除它们。而是根据配置的保留策略，如保留一定时间或达到特定大小后，才删除旧的日志文件。这种设计允许消费者回溯消费，同时避免了因大量日志导致的性能下降，因为Kafka优化了对大量日志的处理能力。消费者可以分为两种模式：同步消费（如简单的消费者）和高阶消费（如消费者小组）。高阶消费者支持自动offset提交，使得消费者组内的成员可以实现负载均衡和故障转移。 Kafka是一个强大且灵活的实时数据处理工具，广泛应用于日志聚合、流式处理、监控数据收集等多种场景。其高性能、高可用性和容错性使得它成为大数据领域中不可或缺的一部分。

第 5 页共 23 页

Kafka 的设计原理决定，对于一个 Topic，同一个 group 中不能有多于 partition 个

数的 Consumer 同时消费，否则将意味着某些 Consumer 将无法得到消息。

1.1.1.5 Guarantees

1) 发送到 partition 中的消息将会按照它接收的顺序追加到日志中，无论一个

partition 由多少个 log 文件构成，那么它发送给 Consumer 的顺序是一定的。

2) 对于消费者而言，它们消费消息的顺序和日志中消息顺序一致。

3) 如果 Topic 的"replication factor"为 N，那么允许 N-1 个 Kafka 实例失效。只要

有一个 replication 存活，那么此 partition 的读写操作都不会中断。

1.1.2 Use cases

1.1.2.1 Messaging

和一些常规的消息系统相比，Kafka 仍然是个不错的选择。它具备

partitons/replication 和容错，可以使 Kafka 具有良好的扩展性和性能优势。不过到目

前为止，我们应该很清楚认识到，Kafka 并没有提供 JMS 中的"事务性"、"消息传输担

保(消息确认机制)" 、"消息分组"等企业级特性。Kafka 只能作为常规的消息系统使用，

在一定程度上，尚未确保消息的发送与接收绝对可靠(比如，消息重发，消息发送丢失

等)

1.1.2.2 Websit activity tracking

Kafka 可以作为"网站活性跟踪"的最佳工具。可以将网页/用户操作等信息发送到

Kafka 中。并实时监控，或者离线统计分析等。

1.1.2.3 Log Aggregation

Kafka 的特性决定它非常适合作为"日志收集中心"。application 可以将操作日志批

量、异步地发送到 Kafka 集群中，而不是保存在本地或者 DB 中。Kafka 可以批量提

交消息、压缩消息等，这对 Producer 端而言，几乎感觉不到性能的开支。此时

Consumer 端可以使用 Hadoop 等进行系统化的存储和分析。

剩余22页未读，继续阅读

dlxc_it

粉丝: 0
资源: 2

Kafka：分布式消息服务详解

Spark应用与知识深度探讨：Scala编程与Kafka简介

Kafka简介：使用、集群搭建和与SpringBoot整合的消息中间件

Kafka简介：分布式流处理平台的特性、API与扩展组件介绍

简介kafka简介

Kafka学习思维导图-Kafka原理-kafka简介

Go操作kafka—-kafka简介

kafka简介.docx

Kafka简介.pptx

Kafka简介.ppt

kafka简介.txt

最新资源