首页SparkStreaming连接Kafka

SparkStreaming连接Kafka

时间: 2024-04-30 16:24:32 浏览: 97

springboot-kafka-connect-jdbc-streams：主要目标是使用Kafka Connect和Streams。我们有store-api，可在MySQL中插入更新记录；源连接器监视MySQL中插入的更新记录，并将与这些更改相关的消息推送到Kafka；接收器连接器，用于从Kafka读取消息并在ES中插入文档；在Kafka中侦听消息的存储流，使用Kafka Streams对待它们，然后将新消息推回Kafka

springboot-kafka-connect-jdbc-streams 该项目的主要目标是与，和一起玩。为此，我们具有：在中插入/更新记录的store-api ； Source Connectors ，用于监视MySQL插入/更新的记录，并将与这些更改相关的消息推送到Kafka ； Sink Connectors ，用于监听来自Kafka消息并在插入/更新文档；最后， store-streams会监听来自Kafka消息，使用Kafka Streams对待它们，然后将新消息推回到Kafka 。项目图应用领域商店API 整体式应用程序，它公开了REST API来管理Customers ， Products和Orders 。数据存储在MySQL 。存储流连接到Kafka并使用Kafka Streams API将一些“输入”主题转换为Kafka新的“输出”主题的Spring Boot应用程序。先决条件（反）序列化格式为了运行此项目，您可以使用或格式将数据串行化/反序列化Kafka使用的binary格式。默认格式为JSON 。在本文档中，我将指出您要使用Av

要在Spark Streaming中连接Kafka，需要使用KafkaUtils类提供的createDirectStream方法。以下是连接Kafka并在Spark Streaming中消费消息的示例代码： ``` import org.apache.spark.streaming.kafka._ val kafkaParams = Map[String, String]("metadata.broker.list" -> "localhost:9092") val topics = Set("my-topic") val stream = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder]( ssc, kafkaParams, topics) stream.map(_._2).print() ssc.start() ssc.awaitTermination() ``` 在上面的示例代码中，我们首先创建一个名为kafkaParams的Map对象，其中包含Kafka集群的地址和端口。然后，我们定义了要消费的Kafka主题的集合。接下来，我们使用KafkaUtils.createDirectStream方法创建了一个输入DStream，该方法使用指定的参数连接到Kafka，并从指定的主题中消费消息。最后，我们使用map操作将DStream中的键值对转换为只包含消息值的DStream，并将其打印出来。需要注意的是，该示例使用了Kafka 0.10版本及以上的新消费者API。如果您使用的是旧版本的Kafka，则需要使用不同的API。

阅读全文