Kafka面试题集：生产者消费者操作与模式详解

需积分: 0 27 浏览量更新于2024-08-03 收藏 17KB DOCX 举报

Kafka是一种分布式流处理平台，专为大规模实时数据处理和消息传递而设计。以下是从文档中提炼出的一些关键知识点： 1. **获取Topic列表**: Kafka提供了`bin/Kafka-topics.sh`命令行工具，用于列出集群中的Topic。通过`--zookeeper localhost:2181`参数指定Zookeeper服务器地址，可以查询到当前可用的Topic列表。 2. **生产者和消费者命令行**: - 生产者命令：`bin/Kafka-console-producer.sh --broker-list 192.168.43.49:9092 --topic Hello-Kafka`，用户可以通过这个命令行工具将消息发布到指定主题，其中broker列表来自`server.properties`中的`listeners`配置。 - 消费者命令：`bin/Kafka-console-consumer.sh --zookeeper localhost:2181 --topic Hello-Kafka --from-beginning`，允许用户交互式地从指定主题开始接收消息。 3. **模式选择：拉取与推送**: - Kafka的设计初衷倾向于消费者从broker拉取消息（Pull模式），这有助于消费者根据自身消费能力进行控制，避免因速率差异导致的问题。 - Push模式（如Scribe和Apache Flume）将消息主动推送给消费者，可能会导致消费者过载或消息堆积。Kafka通过Pull模式解决了这个问题，允许消费者自主决定拉取频率和批量大小。 - Pull模式的优点包括灵活性（消费者可以根据需求调整消费策略）、避免消息浪费，但缺点是消费者可能需要不断轮询以等待新消息。 4. **参数设置与优化**: Kafka提供了参数来处理消费者阻塞问题，例如设置`consumer.poll.interval.ms`等，允许消费者在无新消息时进入睡眠状态，减少资源消耗。 5. **生产者与消费者角色**: - 生产者负责将数据推送到Kafka broker，提供一个可靠的、异步的消息发布机制。 - 消费者则从broker拉取消息，形成一个可靠的消息订阅和消费模型，适合于实时分析、日志处理等场景。这些知识点概述了Kafka的基本操作和其核心设计理念，对于理解和准备Kafka相关的面试非常有帮助。在实际应用中，了解这些命令行工具的使用以及模式选择背后的原因，能够展示对Kafka架构和工作原理的深入理解。

如何获取 topic 主题的列表

bin/Kafka-topics. sh -list --zookeeper localhost:2181

生产者和消费者的命令行是什么?

生产者在主题上发布消息：

1、bin/Kafka-console-producer. sh --broker-list 192.168.43.49:9092--topic Hello-Kafka

2、注意这里的 IP 是 server. properties 中的 listeners 的配置。接下来每个新行就是输入一条新消息。

3、消费者接受消息：

4、bin/Kafka-console-consumer. sh --zookeeper localhost:2181 -topic Hello-Kafka--from-beginning

consumer 是推还是拉?

1、Kafka 最初考虑的问题是,customer应该从 brokes拉取消息还是 brokers 将消息推送到 consumer,也

就是 pull 还 push。在这方面,Kafka 遵循了一种大部分消息系统共同的传统的设计:producer 将消息推

送到 broker,consumer 从 broker 拉取消息。

2、一些消息系统比如 Scribe 和 Apache Flume 采用了 push 模式,将消息推送到下游的 consumer。这

样做有好处也有坏处：由 broker 决定消息推送的速率，对于不同消费速率的 consumer 就不太好处

理了。消息系统都致力于让 consumer 以最大的速率最快速的消费消息，但不幸的是，push 模式下，

当 broker 推送的速率远大于 consumer 消费的速率时,consumer 恐怕就要崩溃了。最终 Kafka 还是选

取了传统的 pull 模式。

3、Pull 模式的另外一个好处是 consumer 可以自主决定是否批量的从 broker 拉取数据。Push 模式必

须在不知道下游 consumer 消费能力和消费策略的情况下决定是立即推送每条消息还是缓存之后批

量推送。如果为了避免 consumer 崩溃而采用较低的推送速率，将可能导致一次只推送较少的消息

而造成浪费。Pull 模式下，consumer 就可以根据自己的消费能力去决定这些策略。

4. Pull 有个缺点是,如果 broker 没有可供消费的消息,将导致 consumer 不断在循环中轮询，直到新消

息到 t 达。为了避免这点，Kafka 有个参数可以让 consumer 阻塞知道新消息到达(当然也可以阻塞知

道消息的数量达到某个特定的量这样就可以批量发送)。

讲讲 Kafka 维护消费状态跟踪的方法

1、大部分消息系统在 broker 端的维护消息被消费的记录：一个消息被分发到 consumer 后 broker 就

马上进行标记或者等待 customer 的通知后进行标记。这样也可以在消息在消费后立马就删除以减

少空间占用。

2、但是这样会不会有什么问题呢?如果一条消息发送出去之后就立即被标记为消费过的，一旦

consumer 处理消息时失败了(比如程序崩溃)消息就丢失了。为了解决这个问题，很多消息系统提供

了另外一个个功能：当消息被发送出去之后仅仅被标记为已发送状态，当接到 consumer 已经消费

成功的通知后才标记为已被消费的状态。这虽然解决了消息丢失的问题，但产生了新问题，首先

如果

下载后可阅读完整内容，剩余4页未读，立即下载

老歪不歪

粉丝: 44
资源: 4368

Kafka面试题集：生产者消费者操作与模式详解

Kafka面试题集锦与详细解析（程序员求职必看）

架构师必备Kafka面试26题解析与答案

程序员面试宝典：Kafka详细面试解析

Kafka 17道面试题和答案.docx

kafka 35道面试题和答案.docx

Kafka 50道面试题和答案.docx

Kafka 40道面试题和答案.docx

"Java 208道面试题详实权威清单

"Java 208道面试题详实清单

Font Awesome图标字体库提供可缩放矢量图标,它可以被定制大小、颜色、阴影以及任何可以用CSS的样式

最新资源