FlinkSQL1.11新功能与最佳实践是由FlinkPMC成员云邪在Apache Flink Meetup 2020·上海站的演讲中分享的内容,它着重介绍了新版本在Table&SQL中的关键改进和开发者实用技巧。以下是四个核心部分的详细解读:
1. **社区发展回顾** (Flink 1.8-1.11): 自2019年阿里巴巴将Blink源码贡献给Flink社区并发布1.8版本以来,Flink的活跃度显著提升,代码提交量以每年50%的速度增长。国内开发者积极参与,中文社区发展迅速,到2020年6月,中文邮件列表用户数量首次超过英文邮件列表,7月更是达到了50%的比例,显示出Flink社区的活力和增长势头。
2. **新功能解析**:
- **简化Connector参数**: FLIP-122是Flink1.11中的一个重要改进,它减少了连接器参数的复杂性,以Kafka为例,之前的DDL需要详细声明复杂的属性,而在1.11中,这种冗余被大大简化,提高了开发效率。
- **动态Table参数和LIKE语法**: FlinkSQL通过减少代码冗余,引入了动态Table参数和LIKE语法,使得数据处理更加灵活和便捷,有助于快速进行测试和重构。
3. **Hive数仓支持和 CDC数据同步**: 新版本强化了对Hive数仓的实时化支持,同时FlinkSQL引入了Change Data Capture (CDC)的最佳实践,使得流批一体操作更为顺畅,这对于数据仓库的实时更新和一致性维护至关重要。
4. **未来规划展望**: 除了当前的改进,FlinkSQL1.12还有更多的规划,但演讲并未详述具体细节,表明社区将持续关注易用性和性能的提升,以满足不断变化的用户需求。
总结起来,FlinkSQL1.11在易用性和连接性方面进行了大量优化,降低了开发者的使用门槛,并且加强了与Hive等数据存储系统的集成,展示了Flink在大数据处理领域的新进展和持续发展的潜力。对于Flink用户和开发者来说,这是一个值得关注和学习的重要版本。