flink 流批一体
时间: 2023-08-15 19:09:36 浏览: 208
基于批(DataX),流(Flink-CDC、Chunjun)一体,提供简单易用的操作界面,降低用户实施各端 之间数据同步的实施
Flink的流批一体指的是将流计算和批计算结合在一起进行数据处理和分析的能力。通过流批一体化的架构,Flink能够同时支持流式数据和批处理数据的处理和分析。
在流批一体的架构下,Flink提供了统一的SQL和Table表达能力,以及统一的Query Processor和Runtime。在最新的版本中,Flink已经实现了DataStream API的流批一体化,使得DataStream既可以执行流计算的算子,也可以执行批处理的算子。这意味着DataStream可以同时使用流式算子和批处理算子。
此外,在Flink的流批一体架构中,Flink的connector也是流批混合的。它可以读取数据库全量数据同步到数据仓库,并通过Change Data Capture(CDC)读取Binlog进行增量和全量的同步。Flink内部会自动协调这些操作,实现了流批一体的价值。
总而言之,Flink的流批一体能力使得它能够在同一平台上处理和分析流式数据和批处理数据,提供了更灵活和高效的数据处理和分析能力。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [flink 流批一体](https://blog.csdn.net/javastart/article/details/123448159)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文