Uber的预警生态系统:构建大规模可观察性
版权申诉
189 浏览量
更新于2024-09-02
收藏 79KB DOCX 举报
"Uber在构建其大规模的可观察性系统时,主要关注的是预警生态,以确保服务的稳定性和高效运行。这个系统包括了uMonitor和Neris两个数据中心的警报系统,以及一个黑匣子警报系统,用于应对各种可能的服务中断情况。uMonitor是基于目标的警报系统,依赖于M3目标数据库,而Neris则负责主机级基础架构的监控。这两个系统都整合到同一个通知和警报管道中,以实现统一管理和响应。此外,他们还开发了Origami平台来优化警报的反复数据删除,并努力提高警报的信噪比,确保重要信息的有效传递。"
在Uber的软件架构中,微服务的数量达到了数千个,这支撑了公司的全球扩张和快速迭代。为了应对这种复杂性和规模,Observability团队设计了一个强大的预警生态系统。这个系统的核心是警报机制,它能在问题发生时即时发现、缓解并通知工程师。
uMonitor和Neris是这个预警生态的关键组成部分。uMonitor通过检查M3数据库中的目标来触发警报,提供了一种基于时间序列目标的警报解决方案,能自动和手动创建多种警报。另一方面,Neris专注于主机级别的监控,对于那些不在M3中的目标进行警报检查。这两种系统的结合,使得Uber能够全面覆盖从微服务到基础架构的各种潜在问题。
为了提高警报系统的可靠性和效率,Uber还构建了黑匣子警报系统。这种系统在内部系统故障或数据中心完全中断时,仍能从外部检测到高级别的服务中断,确保即使在极端情况下也能提供预警。
在扩展性和性能方面,Uber告别了早期的Nagios和Graphite,转而开发了自己的M3目标平台,以解决可扩展性问题。同时,uMonitor的设计充分考虑了灵活性和多样性,可以处理各种自定义和预定义的警报场景。Origami平台的引入则旨在解决警报重复和数据清理的问题,进一步提升了系统的效率。
总结来说,Uber的大规模可观察性系统是一个综合性的解决方案,涵盖了目标监控、警报触发、通知管理以及异常情况下的备份预警,确保了在复杂分布式系统中的服务稳定性。这一系统体现了Uber在面对大规模分布式架构挑战时的创新和技术实力。
2021-09-27 上传
2021-09-27 上传
2021-09-27 上传
2021-11-25 上传
2021-02-05 上传
2021-09-27 上传
2021-02-09 上传
2023-06-12 上传
2021-10-13 上传
bingbingbingduan
- 粉丝: 0
- 资源: 7万+
最新资源
- SSM Java项目:StudentInfo 数据管理与可视化分析
- pyedgar:Python库简化EDGAR数据交互与文档下载
- Node.js环境下wfdb文件解码与实时数据处理
- phpcms v2.2企业级网站管理系统发布
- 美团饿了么优惠券推广工具-uniapp源码
- 基于红外传感器的会议室实时占用率测量系统
- DenseNet-201预训练模型:图像分类的深度学习工具箱
- Java实现和弦移调工具:Transposer-java
- phpMyFAQ 2.5.1 Beta多国语言版:技术项目源码共享平台
- Python自动化源码实现便捷自动下单功能
- Android天气预报应用:查看多城市详细天气信息
- PHPTML类:简化HTML页面创建的PHP开源工具
- Biovec在蛋白质分析中的应用:预测、结构和可视化
- EfficientNet-b0深度学习工具箱模型在MATLAB中的应用
- 2024年河北省技能大赛数字化设计开发样题解析
- 笔记本USB加湿器:便携式设计解决方案