京东的大数据计算:Apache Flink的应用与优化
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
"7-3+Apache+Flink在京东的应用与优化.pdf"主要讲述了Apache Flink在京东的发展历程、平台架构、应用案例以及针对社区版Flink进行的优化改进。 Apache Flink在京东的发展历程始于2014年,经历了从第一代流式处理到新一代流批一体实时计算平台的演变。在2017年之后,Flink逐渐实现了全部容器化,到2018年,京东采用了Flink 1.8和1.9版本,进一步发展到2019年和2020/2021年的Flink 1.10和1.12,引入了SQL支持和微批处理功能。京东实时计算平台(JRC)作为统一引擎,支持流处理和批处理,并具备智能化特性。 平台架构方面,Flink运行在Kubernetes(K8s)之上,依赖Zookeeper进行协调,数据存储包括HDFS、HBase、ES和JimDB等,提供实时数仓、实时大屏、实时报表、实时监控、实时推荐和实时风控等多种应用场景。目前,京东的Flink集群规模超过6000个节点,服务超过20个一级部门,运行着3600多个Flink任务,峰值处理能力达到每秒6亿条数据。 在Flink优化改进上,针对业务痛点,京东进行了深度定制和优化。例如,解决了并行度调整后网络buffer不足的问题,通过增加网络buffer预估来提升系统稳定性;为了解决SQL任务无法指定算子配置和任务所需Slot数不清楚的难题,引入了槽位分组预览功能,使得用户可以更清晰地了解任务资源需求;同时,简化任务调优过程,提供了预览拓扑的功能,使任务提交时能更好地配置Name和Parallelism,增强了易用性。 此文件详细展示了Apache Flink在京东的广泛应用和持续优化,强调了京东如何通过技术创新和定制化开发,解决实际业务中的挑战,以满足大规模实时计算的需求。这些经验对于其他企业和开发者在使用Flink时具有很高的参考价值。
剩余20页未读,继续阅读
- 粉丝: 12w+
- 资源: 9195
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 多模态联合稀疏表示在视频目标跟踪中的应用
- Kubernetes资源管控与Gardener开源软件实践解析
- MPI集群监控与负载平衡策略
- 自动化PHP安全漏洞检测:静态代码分析与数据流方法
- 青苔数据CEO程永:技术生态与阿里云开放创新
- 制造业转型: HyperX引领企业上云策略
- 赵维五分享:航空工业电子采购上云实战与运维策略
- 单片机控制的LED点阵显示屏设计及其实现
- 驻云科技李俊涛:AI驱动的云上服务新趋势与挑战
- 6LoWPAN物联网边界路由器:设计与实现
- 猩便利工程师仲小玉:Terraform云资源管理最佳实践与团队协作
- 类差分度改进的互信息特征选择提升文本分类性能
- VERITAS与阿里云合作的混合云转型与数据保护方案
- 云制造中的生产线仿真模型设计与虚拟化研究
- 汪洋在PostgresChina2018分享:高可用 PostgreSQL 工具与架构设计
- 2018 PostgresChina大会:阿里云时空引擎Ganos在PostgreSQL中的创新应用与多模型存储