Kafka生态系统详解：角色与核心概念

Kafka

需积分: 9 21 浏览量更新于2024-09-04 收藏 362KB DOCX 举报

身份认证购VIP最低享 7 折!

30元优惠券

"Kafka知识点总结，包括其生态系统中的角色、消费者组、分区、副本、Zookeeper的角色以及Kafka的特点、使用场景、优缺点、架构和API等核心概念。" Kafka是一个分布式的消息发布订阅系统，它的设计目标是提供高吞吐量、低延迟的数据传输能力。在Kafka的生态系统中，有四个关键角色： 1. 生产者(Producer)：负责将消息发布到Kafka集群的特定主题(Topic)中。生产者可以配置策略来决定如何将消息分配到不同的分区。 2. Kafka集群(Broker)：由多个节点组成，每个节点都是一个Kafka服务器，存储并处理主题的分区数据。 3. 消费者(Consumer)：从Kafka集群中订阅并消费消息。每个消费者都属于一个消费组，同一组内的消费者可以协同工作，共同处理一个主题的所有分区。 4. Zookeeper：作为协调者，Zookeeper在Kafka中用于管理集群配置、选举分区的主副本以及维护消费者组的成员关系和偏移量。在Kafka中，主题被划分为多个分区(Partition)，每个分区又由多个segment文件段组成，包含.log文件存储实际数据，.index文件用于快速定位数据。每个分区有一个主副本(Leader)，负责接受生产和消费请求，其他副本(Follower)则用于数据备份。分区的特性决定了消费者的消费行为。一个分区只能被一个消费组内的一个消费者消费，确保消息的顺序性。而消费者的最大并发度由主题的分区数量决定，这意味着增加分区数量可以提高消费者并行处理的能力。 Kafka适用于多种场景，如应用耦合、异步处理、流量控制和消息驱动的系统设计。它的优点包括高可靠性、可扩展性、高性能、数据持久化和时效性。然而，它也有一些缺点，如非实时数据传输、仅支持分区内的消息有序、可能的消息重复消费，以及对Zookeeper的依赖。 Kafka的架构包括生产者、消费者、StreamAPI和ConnectAPI等接口，分别用于消息的生产和消费，以及复杂的数据处理和系统集成。其中，StreamAPI允许开发者处理实时数据流，而ConnectAPI则方便与其他系统进行数据同步。 Kafka是一个强大的工具，广泛应用于大数据处理和实时流处理场景，但使用时也需要考虑其特性限制，合理设计主题和分区，以及适当地利用Zookeeper的管理功能。

资源详情

资源推荐

Kaa 知识点总结

1、 Kaa 生态系统四大角色，生产者(Producer)、kaa 集群(Broker)、消费者(Consumer)、zookeeper

2、每个消费者都必须属于一个消费组，一个组内的消费者可以多个。

3、一个 Topic 可以有 1 到多个多个分区（Paron）

4、一个分区可以有 1 到多个 segment。

5、每个 segment 可以有由一个 log 和一个 index 组成。

6、被复制的分区叫做主副本（Leader）,复制出来的叫做从副本（Follower）

7、生产者只往主副本写数据，消费者只在主副本拉取数据。

8、从副本只做数据备份，不做数据读写。

【红色字体表示隐藏知识点】

9、一个分区内的一条数据，只能被一个消费组内的一个消费者消费。

10、消费者的最大并发度由 topic 的分区数量决定

11、分区副本的数量必须小于等于 broker 的数量

12、一个 topic 内的多个分区，每个分区只是所有数据的一部分。所有分区的数据累加到一起是这个

topic 的全部数据。

13 、 zookeeper 中记录了 broker 的 id 、消费者消费数据的 o*set, 消费者与 paron 的对应关系

（ConsumerA—> Paron-0, ConsumerB—> Paron-1）

1、什么是 kaa

是一个分布式，分区的，多副本的，多订阅者的消息发布订阅系统。

2、kaa 的使用场景

应用耦合、异步处理、限流削峰、消息驱动的系统

下载后可阅读完整内容，剩余5页未读，立即下载

睡覺了

粉丝: 694
资源: 11

Kafka生态系统详解：角色与核心概念

kafka操作详解.docx

class org.apache.kafka.common.serialization.StringSerializer is not an instance of org.apache.kafka.common.serialization.Deserializer

error fatal error during kafkaserver startup. prepare to shutdown (kafka.server.kafkaserver) kafka.zookeeper.zookeeperclienttimeoutexception: timed out waiting for connection while in state: connecting

kafka启动报错 error exiting kafka (kafka.server.kafkaserverstartable)

kafka.kerberos.service.name=kafka

[2023-09-19 06:52:28,690] ERROR Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer)

failed to start bean 'org.springframework.kafka.config.internalkafkalistenerendpointregistry'; nested exception is org.apache.kafka.common.kafkaexception: failed to construct kafka consumer

Could not resolve placeholder 'spring.kafka.ssl.trust-store-password' in value "${spring.kafka.ssl.trust-store-password}"报错

kafka.collector.json.brokers

error org.apache.kafka.common.errors.invalidreplicationfactorexception: replication factor: 1 larger than available brokers: 0. (kafka.admin.topiccommand$)

FATAL Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer) kafka.common.KafkaException: Failed to acquire lock on file .lock in /tmp/kafka-logs. A Kafka instance in another process or thread is using this directory. at kafka.log.LogMana

springboot 如何修改kafka的max.request.size

ERROR [KafkaServer id=0] Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer)

kafka.kerberos.sasl.mechanism=GSSAPI

kafka.client.check.interval=60

ERROR org.apache.kafka.common.errors.TopicExistsException: Topic 'test_topic' already exists. (kafka.admin.TopicCommand$)

kafka报错： org.apache.kafka.requests.IsolationLevel

kafka.kerberos.security.protocol=SASL_PLAINTEXT

最新资源