饿了么大数据平台快速扩张之路:从100到1000+

0 下载量 54 浏览量 更新于2024-08-27 收藏 677KB PDF 举报
"饿了么大数据平台建设" 饿了么的大数据平台自2015年5月成立以来,经历了一段快速发展的时期。在短短一年内,其Hadoop集群规模从100多个节点迅速扩张至1000多个节点,即使在实施了数据生命周期管理策略的情况下,这一增长速度依然显著。同时,流计算集群尽管规模较小,但其吞吐量也实现了10倍以上的提升,部分topic的数据处理能力达到了每秒百万条以上。 平台的逻辑架构如图1所示,这是一个持续演进的架构,旨在满足不断增长的业务需求。饿了么数据平台团队在成立初期面临着多重挑战,包括团队人数少、任务繁重、经验积累不足、对质量标准的模糊认识以及故障处理的不一致性。因此,团队将建设重点放在提高效率、确保质量以及实现系统的可扩展性上。 在技术选型方面,饿了么团队遵循"3T"原则:首先明确要解决的问题和适用的场景(Trouble),其次考察可用的技术选项(Technology),最后评估团队对目标技术的掌握程度和适应性(Team)。例如,在选择即席查询引擎时,团队在Presto和SparkSQL之间进行了权衡。虽然SparkSQL拥有更高的社区活跃度和更好的SQL兼容性,但其在测试中的稳定性不佳,而Presto则表现出更好的稳定性和运行效率。考虑到团队对Spark技术的掌握程度不足,且有成员具有Presto的使用和管理经验,最终选择了Presto作为即席查询引擎。 在架构设计阶段,面对业务的快速发展,饿了么团队致力于构建一个能够自动应对变化、减少人工干预的理想系统,追求可持续扩展的架构。这样的设计目标旨在确保系统上线后能高效、稳定地运行,以满足不断增长的业务需求和用户期望。 饿了么大数据平台的建设历程体现了团队在技术选型、架构设计以及应对挑战方面的策略和智慧,通过不断地优化和创新,实现了平台的快速成长和高效运营。