Kafka消息中间件详解：分区、顺序消费与数据持久化

需积分: 0 22 浏览量更新于2024-08-05 收藏 206KB PDF 举报

Kafka是一种分布式流处理平台，专为高吞吐量、实时处理和数据流应用设计，其核心功能是消息传输和消息队列服务。以下是关于Kafka的几个关键知识点： 1. **消息组织**：Kafka将消息划分为不同的主题（Topics），每个主题下又进一步细分为多个分区（Partitions）。分区有助于提高并发访问能力，通过将数据均匀分布到不同的服务器，避免单点故障。 2. **顺序消费与一致性**：消费者按照分区顺序读取消息，不支持随机访问，但可以通过Zookeeper中的偏移量（offset）控制消费位置，实现从指定位置开始读取。 3. **消息持久化**：Kafka的设计考虑到了数据持久性，收到的消息暂存于内存缓冲，达到预设阈值后才写入磁盘，以减少磁盘I/O。然而，完全依赖操作系统文件系统的优化是有限的。 4. **数据冗余与容错**：每个分区可以配置备份副本，当主服务器出现问题时，可以从备份服务器恢复数据。通过 Leader-Follower模式，一个分区有一个负责写入和协调的领导者（Leader），其余为从属者（Follower）。 5. **群组与订阅模式**：Kafka中的消费者可以组成消费组（Consumer Group），每个组内的消费者独立消费消息。同一组的消费者共享同一个主题的分区，而不同组的消费者则形成发布-订阅模式，消息广播给所有订阅者。 6. **消费控制**：Kafka采用Pull模式，消费者主动从Broker拉取消息，这样消费者可以根据自身处理能力灵活控制消息消费速率和进度。 7. **性能优化**：除了磁盘I/O和网络I/O外，Kafka也关注批量处理消息和消息压缩，以提升性能。这与JMS中的push模式相比，提供了更好的灵活性和控制性。 Kafka是一个强大的分布式消息传递系统，它通过主题、分区、复制和消费组的机制，提供了一种高效、可靠且可扩展的消息传输解决方案。理解和掌握这些特性对于在实际项目中有效利用Kafka至关重要。

猿灯塔，做程序员的引导者

www.yuandengta.com

1. kafka：

1.消息分类按同类别,分成同的Topic,Topic拆分成多个

partition,每个partition均衡分散到同的服务(提󰷼并发访问的能)

2.消费者按顺序从partition中读取,持随机读取数据,但可通过改变保

存到zookeeper中的offset位置实现从任意位置开始读取

3.服务消息定时清除(管有没有消费)

4.每个partition还可以设置备份到其他服务上的个数以保证数据的可󰉁

性。通过Leader,Follower式

5.zookeeper保存kafka服务和客户端的所有状态信息.(确保实际的客户

端和服务轻󰮢级)

6.在kafka中,个partition中的消息只会被group中的个consumer消

费;每个group中consumer消息消费互相独󰐩;我们可以认为个group是

个"订阅"者,个Topic中的每个partions,只会被个"订阅者"中的个

consumer消费,过个consumer可以消费多个partitions中的消息

7.如果所有的consumer都具有相同的group,这种情况和queue模式很像;

消息将会在consumers之间负载均衡.

8.如果所有的consumer都具有同的group,那这就是"发布-订阅";消息将

会播给所有的消费者.

9.持久性,当收到的消息时先buffer起来,等到定的阀值再写磁盘

件,减少磁盘IO.在定程度上依赖OS的件系统(对件系统本身优化乎可

能)

10.除磁盘IO,还应考虑󰕲络IO，批󰮢对消息发送和接收,并对消息进󰢩压

缩。

11.在JMS实现中,Topic模型基于push式,即broker将消息推送给

consumer端.过在kafka中,采󰉁pull式,即consumer在和broker建󰐩连

接之后,主动去pull(或者说fetch)消息;这种模式有些优点,󰶳先consumer端可

以根据󰙵的消费能适时的去fetch消息并处󰇹,且可以控制消息消费的进度

(offset);此外,消费者可以良好的控制消息消费的数󰮢,batch fetch.

12.kafka需记录消息是否接收成功,是否要重新发送等,所以kafka的

producer是󰴬常轻󰮢级的,consumer端也只需要将fetch后的offset位置注册

到zookeeper,所以也是󰴬常轻󰮢级的.

--kafka使󰉁场景

对于些常规的消息系统,kafka是个错的选

择;partitons/replication和容错,可以使kafka具有良好的扩展性和性能优

势.

过到󰋴前为,我们应该很清楚认识到,kafka并没有提供JMS中的"事务

下载后可阅读完整内容，剩余3页未读，立即下载

葡萄的眼泪

粉丝: 19
资源: 303

Kafka消息中间件详解：分区、顺序消费与数据持久化

广晟光伏单晶硅片检验标准zy-08.2.4-07.pdf

08.2-SPI驱动TLC5615[汇编].pdf

rh-maven35-glassfish-el-javadoc-3.0.1-0.4.b08.2.el7.noarch.rpm

rh-maven35-glassfish-el-api-3.0.1-0.4.b08.2.el7.noarch.rpm

rh-maven35-glassfish-el-3.0.1-0.4.b08.2.el7.noarch.rpm

青创文章系统 1.9.08.2.5

实验08.2.exe

08.2、程序：FreeRTOS+LCD+Touch+UART1.zip

08.2、程序：FreeRTOS+LCD+Touch.zip

CPSC-CH-E1002-08.3

最新资源