阿里巴巴实时计算新特性:Flink on Kubernetes详解

需积分: 5 1 下载量 3 浏览量 更新于2024-08-03 收藏 8.35MB PDF 举报
“藏经阁-阿里巴巴大数据产品最新特性介绍—实时计算 Flink on Kubernetes.pdf” 本文将详细介绍阿里巴巴大数据产品——实时计算 Flink on Kubernetes 的最新特性。Flink on Kubernetes 是阿里巴巴实时计算产品的一个新形态,它结合了 Apache Flink 的强大功能与 Kubernetes 的优势,以提供更高效、灵活和可扩展的实时数据处理能力。 首先,Flink 1.9 版本引入了主要的新功能,如统一的 SQL 支持,这使得用户能够更方便地在流处理和批处理中使用 SQL。Flink 的 SQL 优化器和执行器经过改进,提供了更高的性能。此外,Flink 1.9 引入了统一高效的算子框架,允许更灵活的 chaining 策略,并且支持自定义调度插件,以适应各种工作负载需求。增量 checkpoint 功能则进一步提高了系统的容错性和恢复效率。 实时计算 Flink 产品在阿里云上提供了三种托管模式:共享模式、独享模式和 Flink on K8S。共享模式下,用户可以使用 Flink 1.6 至 1.9 的不同版本,并享受到指标收集和展示等增值服务。独享模式则增加了 BlinkSQL 和作业监控报警等功能。Flink on Kubernetes 提供了完整的开发控制台,支持 BlinkSQL、UDX、指标收集、作业监控和报警,以及 Ververica 平台,这是一个基于 Flink 的企业级解决方案。 选择 Flink on Kubernetes 的原因在于 Kubernetes(K8S)提供的资源隔离、生态系统优势和资源弹性。对于实时风控、实时推荐等高优先级任务,K8S 能够保证常驻进程并确保任务的重要性。同时,K8S 的资源管理机制能够根据需求动态调整资源分配,适应业务波动。 在 Flink on Kubernetes 中,Ververica Platform 提供了 Workspace、Runtime 等组件,支持 DataStream/Table API、Streaming JOB 和 UnifiedSQL,便于进行数据分析和机器学习。Alink、Libra 和 Gemini 等工具进一步增强了机器学习和智能调优的能力。Prometheus、Metric/Alerts、ELK/SLS 和 Logs 等监控和日志管理工具确保了系统的稳定运行和问题排查。 最后,用户可以通过阿里云工单系统申请试用 Flink on Kubernetes,提供产品名称和试用申请内容,即可开始体验这个高效、全面的实时计算解决方案。