flink sql 常用配置

在Flink SQL中，常用的配置包括：regular join、Split Distinct优化方法、LocalGlobal优化、MiniBatch等。 regular join是Flink SQL中常用的连接操作，包括inner join、left join和right join。在regular join中，左右表的数据都会一直保存在状态里，不会清理。如果需要清理数据，可以设置TTL（Time-To-Live）或使用Flink SQL的interval join。 Split Distinct优化方法是一种优化方法，可以用于处理包含UDAF（User-Defined Aggregation Function）的Flink SQL语句。但目前在包含UDAF的Flink SQL中不能使用Split Distinct优化方法。 LocalGlobal优化是Flink SQL中的一种优化策略。该优化策略可以将聚合操作拆分为两个GROUP聚合操作，并参与LocalGlobal优化。这个功能在Flink 1.9.0版本及以上版本才支持。 MiniBatch是Flink SQL中的一种机制，可以将输入数据分批处理，以减少资源消耗。开启MiniBatch需要依赖于MiniBatch的参数设置。常用的MiniBatch参数包括： - `table.exec.mini-batch.enabled`：是否开启MiniBatch，默认为false。 - `table.exec.mini-batch.allow-latency`：批量输出的间隔时间，用于控制数据处理的延迟。 - `table.exec.mini-batch.size`：每个批次最多缓存数据的条数，可以根据需求进行调整。除了上述常用配置外，还可以根据具体需求设置其他参数，如聚合策略`table.optimizer.agg-phase-strategy`，用于控制聚合操作的执行策略。默认为AUTO，还支持TWO_PHASE（使用LocalGlobal两阶段聚合）和ONE_PHASE（仅使用Global一阶段聚合）两种策略。示例代码中展示了如何设置这些参数： ``` // 初始化table environment TableEnvironment tEnv = ... // 获取tableEnv的配置对象 Configuration configuration = tEnv.getConfig().getConfiguration(); // 设置参数： // 开启MiniBatch configuration.setString("table.exec.mini-batch.enabled", "true"); // 批量输出的间隔时间 configuration.setString("table.exec.mini-batch.allow-latency", "5 s"); // 防止OOM，设置每个批次最多缓存数据的条数，可以设为2万条 configuration.setString("table.exec.mini-batch.size", "20000"); // 开启LocalGlobal configuration.setString("table.optimizer.agg-phase-strategy", "TWO_PHASE"); ``` 综上所述，这些是Flink SQL中常用的配置。123 #### 引用[.reference_title] - *1* *2* *3* [Flink 优化(六) --------- FlinkSQL 调优](https://blog.csdn.net/m0_51111980/article/details/130102786)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

flink sql 常用配置

相关推荐

flink-sql集成rabbitmq

Flink SQL大数据项目实战（基于Flink1.14.3版本）

高性能FlinkSQL优化技巧

flinksql常用语法

flinksql配置

flinksql怎么设置并行度

flink sql设置checkpoint

flink sql 配置日志级别

flink sql客户端设置并行度

Flink1.17 FlinkSQL

flink sql 设置 SQL 方言为 Hive

flink sql client

flink sql with

flink sql 设置source并行度

flink sql 中设置为hive语言

flink sql 批处理

flink sql介绍

flink sql exists

flink sql etl

最新推荐

大数据之flink教程-TableAPI和SQL.pdf

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

解释minorization-maximization (MM) algorithm，并给出matlab代码编写的例子

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

帮我实现在Androidstudio调用chapgpt并提供源码

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf