美团外卖的高可用容灾策略与架构设计

需积分: 9 4 下载量 176 浏览量 更新于2024-07-18 收藏 2.03MB PDF 举报
美团外卖的荣灾能力设计是一项关键的IT战略,针对其作为全球最大的外卖平台,日均处理超过2000万订单的业务需求。为了实现线上事故零容忍的目标,美团外卖构建了一套全面的容灾能力体系,确保高可用性和用户稳定的服务体验。 该体系的核心是围绕业务架构的稳定性进行设计。外卖业务架构采用了松耦合的模块化设计,将整体和局部功能划分为独立的运维单元,以商品交易流程为核心进行建设。质量保障体系的全景图包括监控、报警、日志管理、容灾等多个环节,确保问题发现、定位和解决的闭环。 监控系统是整个体系的重要组成部分,它实时监控系统健康状况,通过可量化的指标来评估客户端系统的业务稳定性、基础能力和性能稳定性,同时将数据上报到公司的监控服务后台。报警系统则根据业务模型设置基线,通过IM、邮件或短信等方式及时通知异常情况。 在核心依赖方面,美团外卖采取了多重备份策略,如通过降级提供可伸缩服务,确保非核心功能如购物车和智能助手的可用性,同时利用快速配置同步能力进行止损。HornSDK配置系统支持动态逻辑执行,可以根据用户的版本、设备和尾号等特性推送个性化的配置,并采用推拉结合的方式进行分钟级更新,且线上线下环境相互隔离。 非核心依赖降级策略允许在不影响核心交易流程的情况下提供附加服务,以保证在故障情况下用户仍能得到基本体验。过载保护限流机制则确保在流量高峰时,业务可用性和用户体验得到最大限度的保障。 美团外卖的荣灾能力设计旨在通过精细的架构设计和全面的监控保障,确保业务在面对各种挑战时仍能保持高效运行,为用户提供无缝的外卖服务体验。这一设计对于大型在线服务企业来说,是提升业务韧性、降低风险的关键要素。
2019-04-11 上传
目录 - 算法篇 美团“猜你喜欢”深度学习排序模型实践 ...................................................................... 4 美团大脑:知识图谱的建模方法及其应用 ...................................................................... 16 深度学习在美团搜索广告排序的应用实践 ...................................................................... 37 美团深度学习系统的工程实践 ...................................................................... 47 美团餐饮娱乐知识图谱——美团大脑揭秘 ...................................................................... 56 美团在O2O场景下的广告营销 ...................................................................... 68 美团外卖骑手背后的AI技术 ...................................................................... 85 基于TensorFlow Serving的深度学习在线预估 ...................................................................... 102 强化学习在美团“猜你喜欢”的实践 ...................................................................... 112 深度学习在文本领域的应用 ...................................................................... 125 机器学习在美团配送系统的实践:用技术还原真实世界 ...................................................................... 143 如何基于深度学习实现图像的智能审核? ...................................................................... 154 深度学习在OCR中的应用 ...................................................................... 163 AI技术在智能海报设计中的应用