微博实时流计算平台演进：从百万TPS到WAIC架构

89 浏览量更新于2024-08-28 收藏 964KB PDF 举报

"如何实现秒级百万TPS？微博WAIC实时流计算平台架构演进" 在构建微博的实时流计算平台的过程中，微博团队面临了从简单实时处理到大规模高吞吐量实时分析的挑战。他们逐步发展出一套高效且适应性强的架构，以满足秒级百万TPS（每秒事务处理数）的需求。以下是对这一演进过程的详细说明： 1. **初入实时流计算** - 2015年至2018年间，微博团队逐步开发并应用实时流计算技术，从物料池系统、用户实时兴趣反馈系统，到人脸识别系统和初步建立实时流计算平台。 - 技术栈中，使用了Spark、Streaming、Flink、Storm、Flume和Kafka等计算引擎和中间件。 - 第一阶段的架构采用Flume收集业务系统日志，写入Kafka，然后由Storm处理数据，实现数据处理和错误恢复。 2. **实时流计算平台初建** - 面对不断增加的业务需求和复杂性，团队决定构建实时流计算平台，以减少人工工作量，提高代码复用，并强化监控。 - 平台目标包括开发可配置的开发框架和统一的监控平台。 - 第二阶段的架构更加复杂，增加了多种数据源接入，如Scribe和Mcq，并使用不同实时集群处理不同业务场景的数据。 3. **自研WeiPig框架** - 为了解决开发人员的效率问题，微博团队自主研发了WeiPig框架，该框架旨在沉淀工作量，简化开发流程，降低代码重复率。 - WeiPig可能是一个基于Pig Latin的扩展，提供更高层次的抽象，以支持实时流处理的配置和定制。 4. **实时流计算平台发展** - 随着平台的发展，监控系统变得至关重要。团队开始构建统一的监控平台，以提供全面的系统视图，及时发现和解决问题。 - 这个阶段可能涉及了自动化工具的引入，如自动报警、日志分析和性能指标收集，以提高故障排查效率。 5. **DQRA设计模式** - DQRA可能是Data Quality, Real-time, Availability, and Reliability的缩写，是构建高效实时流计算平台的关键设计原则。 - 在这个模式下，平台需要确保数据质量，提供实时处理能力，保证服务的可用性，并确保系统的可靠性。通过这些阶段的演进，微博的实时流计算平台逐渐实现了高效、稳定和可扩展的目标，能够处理秒级百万级别的TPS，服务于微博的各种实时数据分析需求，如热词分析等。这一过程反映了技术从简单应用到复杂架构演进的典型路径，以及在应对大数据挑战时，对平台化、标准化和自动化的需求。

人工工作量比较多，即：面对需求时，全靠人编码。

代码重复率比较高，异常排查的方式较为简陋，全靠登录到服务器上，去 Grep 日志。

监控的方式则全靠脚本。

上图是第一阶段所遗留的一些问题。

实时流计算平台初建

那么随着实时流计算的频繁使用、业务场景的增多、以及监控需求的提升，我们意识到需要搭建一个实时流的计算平台。

我们当时所提出的平台目标主要包括：

研发一个工作量可以沉淀，并且可配置的开发框架。

统一所有的监控，打造一个统一的监控平台。

这是第二阶段实时流的初步架构图。在此，我们的接入日志方式丰富了许多。如图，我们既通过 Scribe 进行收集、又从

Kafka 以及 Mcq 里面读取数据。

然后通过 Scribe、或者其他的数据同步服务，将它们接入到实时队列之中，最后在不同的业务场景下，利用不同的实时集群

进行处理。

剩余11页未读，继续阅读

weixin_38717579

粉丝: 2
资源: 887

微博实时流计算平台演进：从百万TPS到WAIC架构

微博机器学习数据中台实践.pptx

matlab小波赤池信息量准则

贝叶斯时空模型传染病预测代码

report ETL .ffff

基于ssm的共享充电宝管理系统设计与实现.docx

操作系统大作业_Linux_命令行_OSWork.zip

Java项目-基于SSM+Jsp的社区管理与服务系统的设计与实现（源码+数据库脚本+部署视频+代码讲解视频+全套软件）

吉他谱_Show Me How To Live - Audioslave.pdf

Linux系统初始化脚本，包括设置时区并同步时间、禁用selinux、关闭防火墙

基于ssm的即动运动网站设计与实现设计.docx

最新资源