Apache Flink：流处理巨头的实战与探索

3星 · 超过75%的资源需积分: 50 42 浏览量更新于2024-07-18 7 收藏 15.04MB PDF 举报

"Flink实践案例" Apache Flink作为大数据处理领域的热门引擎，近年来获得了显著的增长。根据Qubole的报告，Flink在2018年的采用量比2017年增长了125%，这反映出其在设计上的优越性。Flink的崛起主要得益于它在流计算方面的突破，它解决了批处理引擎如Apache Spark在流计算上的局限。Spark Streaming通过快速批处理模仿流计算，但存在性能和功能限制，而Flink则提供了更好的状态管理和基于分布式一致性快照的检查点容错机制，从而在流处理领域展现出强大的能力。 Flink不仅限于流处理，还能够模拟批处理，并支持交互式查询和机器学习等多种数据处理场景，这使它与Spark形成了直接竞争。在实际应用中，像美团、唯品会、滴滴和360等国内互联网巨头都已经采用了Flink进行各种业务场景的处理。Flink的强大功能和不断改进的易用性，例如阿里巴巴贡献的Flink SQL，使其在业界得到了广泛的应用和认可。 Flink的快速发展和广泛应用代表了大数据计算技术的三代变迁，从最初的MapReduce，到Spark，再到现在的Flink，每个阶段都推动了技术的进步和应用的创新。Flink社区的活跃度和各大公司的支持为其持续发展奠定了基础。对于开发者来说，参与到Flink社区中，不仅可以见证技术的演进，还能抓住大数据技术变革的历史机遇。在实际案例中，Flink展现了其在实时处理、故障恢复、高吞吐低延迟等方面的优势。例如，美团可能使用Flink进行实时订单分析，提供即时的业务洞察；唯品会可能利用Flink处理大量电商交易数据，优化库存管理和营销策略；滴滴可能会使用Flink监控和分析交通流量，提升出行服务效率；360可能运用Flink进行网络安全分析，提供更高效的威胁检测。 Flink作为一个全面的数据处理平台，其强大的流处理能力和扩展性吸引了众多企业采用，而其不断完善的生态和社区支持将进一步巩固其在大数据领域的地位。随着Flink的不断发展，我们可以期待更多创新的应用场景和解决方案出现，进一步推动大数据技术的革新。

不仅仅是流计算：Apache Flink

实践

本文来自于余海林在 2018 年 8 月 11 日 Flink China 社区线下 Meetup·北京站的分享。余海林

目前在滴滴出行负责实时流计算相关工作，研发主要是集中在 Apache Flink 上。之前任职于阿

里巴巴，主要负责 TCP/IP 协议栈以及手淘的无线网络优化。

本文主要内容主要包括以下几个方面：

1、 Apache Flink 在滴滴的背景

2、 Apache Flink 在滴滴的平台化

3、 Apache Flink 在滴滴的生产实践

4、 StreamSQL

5、展望规划

Apache Flink 在滴滴

在滴滴，所有的数据基本上可以分为四个大块：

1、轨迹数据：轨迹数据和订单数据往往是业务方特别关心的。同时因为每一个用户在打车以

后，都必须要实时的看到自己的轨迹，所以这些数据有强烈的实时需求。

2、交易数据：滴滴的交易数据，

Apache Flink 在滴滴出行

的应用与实践

作者余海林

整理赵明远

Apache Flink 在滴滴出行的应用与实践

通过看上面这一张图，很明显滴滴平台化可以分为以下几个部分：

• 第一个是上游的数据源，在滴滴内部，数据源用的比较多的差不多有两类，第一类是 Kafka，

Kafka 作为滴滴的一个大型的日志系统，因此 Kafka 用的会比较多，然后还有 DDMQ（滴滴

内部自研的一个消息队列），这两类中件间在数据流输入方面用的比较多。

• 然后对于中间这一块，是滴滴流计算平台的核心部分，应用管控、StreamSQL、WebIDE、诊

断系统都是围绕着这个核心来做的。在滴滴内部现在主要维护了两个引擎，一个是 Flink，

还有一个是 Spark Streaming，滴滴流计算平台上的这两个引擎，用户都是能够非常方便的使

用到的。

• 再往下，用户提交上来的流计算应用都是由平台去做应用管理的，无论是 Flink 还是 Spark

Streaming 应用都是以 On Yarn 模式运行的，流计算平台使用 Yarn 来管理计算资源和集群。

对于需要持久化的一些依赖，在底层平台是存储在 HDFS 上的。

• 最后是流计算平台的下游，在下游当然也包括上游的一些中间件，比如 Kafka 和 DDMQ，当

然在流计算的过程中，不可避免地要使用到 HBase 或者 MySQL，KV 数据库等下游存储。综

上所述这就是滴滴的一个整体平台化的架构。

引擎改进

对于引擎我们主要做了一下这些优化：

• 平台化我们第一个做的工作就是将整个任务提交以及任务管控的各个方面都进行服务化了，

既然要流计算平台化，服务化是肯定要做的。

• 第二是在流计算平台化的过程中，为了能够更好的去限制每一个应用，更好的管理应用的

资源，流计算平台限制了每个 Yarn-session 上只能提交一个 Job，如果在一个 Yarn-session 上

提交多个 Job，平台会进行提示或报错，保证 Job 提交不上去。

• 然后是应用在使用的过程中无法避免的会去做一些升级的操作，比如说一个 Flink Application

在今天使用的时候，很可能没有预估到明天流量会涨很多，这就导致应用在启动的过程中

申请到的资源不够，用户可能要重启去修改代码，修改算子的并行度等。但是重启总是会带

来一定的业务延迟，因此流计算平台提供了支持动态扩容的新特性。Flink Application 在重

启的时候，以前已经在使用的资源不会被释放，而是会被重新利用，平台会根据新的资源使

用情况来进行动态的缩扩。

• 最后一个是在使用官方 Flink 版本的过程中，碰到比较多的问题，例如在 Zookeeper 这一层

面就碰到了不少的问题，平台内部修复了很多围绕 Zookeeper 相关的一些问题。例如

Zookeeper 抖动会导致获取不到 CheckPoint 的 ID，在官方的版本里面会存留一些 bug，平台

内部已经进行修复了。

剩余161页未读，继续阅读

阿华田512

粉丝: 1w+
资源: 12

Apache Flink：流处理巨头的实战与探索

Flink应用案例介绍.pdf

flink-python-examples:使用flinks新的python API的示例集合

flink 开发实例和资料

apache flink 年度最佳实践 pdf

Flink CDC 2.3版本如何实现跨多种数据库系统的实时数据集成与增量更新？请结合阿里巴巴的实践案例进行说明。

flink原理与实践全套教学课件.

Flink推荐学习书籍

对学习flink有帮助的东西

在处理跨多个数据库系统的实时数据集成时，Flink CDC 2.3版本是如何保证增量更新的一致性和实时性？请结合阿里巴巴的实践案例提供详细说明。

apache flink 零基础入门

最新资源