spark 2.3.0 structured streaming详解
时间: 2023-04-23 13:03:40 浏览: 185
spark streaming 2.3.0
Spark 2.3.0是一个开源的分布式计算框架,其中包含了Structured Streaming功能。Structured Streaming是一种基于Spark SQL引擎的流处理框架,它可以将流数据作为一张表来处理,从而实现了流数据的实时处理和分析。Structured Streaming支持多种数据源,包括Kafka、HDFS、S3等,同时还支持多种输出方式,如Kafka、HDFS、S3、JDBC等。Structured Streaming还支持窗口操作、聚合操作、Join操作等常见的流处理操作,同时还支持自定义函数和UDF。Spark 2.3.0的Structured Streaming还引入了新的流式查询优化器,可以更好地优化流式查询的性能。
阅读全文