flink kafka 统计代码

以下是使用Flink和Kafka进行统计的示例代码。首先，需要导入相关的依赖： ```xml <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-streaming-java_${scala.binary.version}</artifactId> <version>${flink.version}</version> </dependency> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-kafka_${scala.binary.version}</artifactId> <version>${flink.version}</version> </dependency> ``` 接下来，创建一个Flink的StreamExecutionEnvironment： ```java StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); ``` 然后，创建一个Kafka的消费者流： ```java Properties props = new Properties(); props.setProperty("bootstrap.servers", "localhost:9092"); props.setProperty("group.id", "test"); FlinkKafkaConsumer<String> consumer = new FlinkKafkaConsumer<>("topic", new SimpleStringSchema(), props); DataStream<String> stream = env.addSource(consumer); ``` 接着，对数据流进行处理和转换，例如统计单词出现的次数： ```java DataStream<Tuple2<String, Integer>> counts = stream .flatMap((String line, Collector<Tuple2<String, Integer>> out) -> { for (String word : line.split(" ")) { out.collect(new Tuple2<>(word, 1)); } }) .keyBy(0) .sum(1); ``` 最后，将结果写入到Kafka的一个新的Topic中： ```java Properties producerProps = new Properties(); producerProps.setProperty("bootstrap.servers", "localhost:9092"); FlinkKafkaProducer<Tuple2<String, Integer>> producer = new FlinkKafkaProducer<>("output-topic", new Tuple2SerializationSchema(), producerProps, FlinkKafkaProducer.Semantic.EXACTLY_ONCE); counts.addSink(producer); ``` 完整的代码示例： ```java import org.apache.flink.api.common.functions.FlatMapFunction; import org.apache.flink.api.java.tuple.Tuple2; import org.apache.flink.streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer; import org.apache.flink.streaming.connectors.kafka.FlinkKafkaProducer; import org.apache.flink.streaming.util.serialization.SimpleStringSchema; import org.apache.flink.util.Collector; import java.util.Properties; public class WordCount { public static void main(String[] args) throws Exception { StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); Properties props = new Properties(); props.setProperty("bootstrap.servers", "localhost:9092"); props.setProperty("group.id", "test"); FlinkKafkaConsumer<String> consumer = new FlinkKafkaConsumer<>("input-topic", new SimpleStringSchema(), props); DataStream<String> stream = env.addSource(consumer); DataStream<Tuple2<String, Integer>> counts = stream .flatMap((String line, Collector<Tuple2<String, Integer>> out) -> { for (String word : line.split(" ")) { out.collect(new Tuple2<>(word, 1)); } }) .keyBy(0) .sum(1); Properties producerProps = new Properties(); producerProps.setProperty("bootstrap.servers", "localhost:9092"); FlinkKafkaProducer<Tuple2<String, Integer>> producer = new FlinkKafkaProducer<>("output-topic", new Tuple2SerializationSchema(), producerProps, FlinkKafkaProducer.Semantic.EXACTLY_ONCE); counts.addSink(producer); env.execute("Word Count"); } private static class Tuple2SerializationSchema implements KafkaSerializationSchema<Tuple2<String, Integer>> { @Override public ProducerRecord<byte[], byte[]> serialize(Tuple2<String, Integer> element, @Nullable Long timestamp) { return new ProducerRecord<>("output-topic", element.f0.getBytes(), element.f1.toString().getBytes()); } } } ```

阅读全文

flink kafka 统计 代码

相关推荐

Flink入门：读取Kafka实时数据流，实现WordCount

并发消费kafka数据并写入hdfs。 基于flink统计实时ip热点统计.zip

Kafka模拟网页浏览实时统计

scala的flink+kafka实时来一条统计pv

java版本的flink读取kafka数据实时uv、pv完整代码实现

flink统计每个区域

flink 流处理 词频统计

写一段复杂的flink代码

scala2.12编写Flink1.14.4消费kafka中的数据，统计商城每分钟的GMV

flink1.11.2 离线统计上个月的数据

编写一篇可行的flink+es+kafka+oracle架构详细配置及代码分层处理数据

scala2.12版本编写Flink1.14消费kafka中的数据，统计商城案例每分钟的GMV，将结果存入redis中

使用scala2.12语言编写Flink1.14.4消费kafka中的数据，统计商城每分钟的GMV，将结果存入redis中

flink的demo

pyflink Kafka

在flink中，计算从kafka传过来的数据中某个字段上字符串“2”的出现次数，并存入postgresql中，帮我写一段代码

flink大数据实验

实时计算用flink

flink-jdbc

kafka实战案例讲解

大家在看

暗通道去雾算法_何凯明去雾_matlab_去雾_去雾算法_暗通道算法_

基于YOLOv10+DeepSort实现视频中目标跟踪算法Python源码+详细使用说明.zip

电信设备-一种血糖数据查询方法及移动终端.zip

FAST FACTORIZED_FFBP论文_FFBP_后向投影.zip

威布尔参数估计，可靠性与寿命预测方向，机械工程,威布尔分布寿命预测,matlab源码.rar

最新推荐

Flink实战：用户行为分析之热门商品TopN统计

世界地图Shapefile文件解析与测试指南

Python环境监控高可用构建：可靠性增强的策略

需要在matlab当中批量导入表格数据的指令

Sqlcipher 3.4.0版本发布，优化SQLite兼容性

Python环境监控性能监控与调优：专家级技巧全集

simulinlk怎么插入线

Java项目中standard.jar压缩包的处理与使用

Python环境监控动态配置：随需应变的维护艺术

怎么在APPDesigner中调用外部函数文件

flink kafka 统计代码

并发消费kafka数据并写入hdfs。基于flink统计实时ip热点统计.zip

flink 流处理词频统计