苏宁大企业级立体监控构建:从过去到未来
需积分: 10 23 浏览量
更新于2024-07-17
收藏 8.84MB PDF 举报
"苏宁大企业级立体式监控的构建,由苏宁易购IT总部监控研发中心总监汤泳主讲,涉及苏宁的AIOps能力建设,包括用户体验监控、服务端调用链、智能告警引擎和实时日志分析等核心系统。监控体系经历了从基础设施监控到多维度融合监控的发展,利用Zabbix、Prometheus等工具,逐步构建起全面的监控网络。"
在苏宁这样的大型企业中,构建一套高效的企业级立体式监控系统至关重要。汤泳,作为苏宁易购IT总部监控研发中心的总监,拥有15年的从业经验,主导了苏宁的“云穆”立体式智能监控产品的研发,旨在确保苏宁控股集团旗下众多系统的稳定运行。
苏宁的监控体系面临的主要挑战包括系统的复杂性、服务间的调用方式多样以及业务环境的复杂性。系统数量庞大,涉及多种调用协议,并且线上线下业务交织,需要对多数据中心、多种服务器类型和大规模部署进行有效监控。
监控体系化建设是逐步演进的过程。2013年开始,苏宁采用了Zabbix进行基础设施监控,随后逐步增加了APP性能监控、服务端性能监控、海量日志分析平台等。到了2018年,监控系统进一步升级,引入了Prometheus等工具,加强了调用链监控、异常监管和智能告警能力,以实现更精细化的监控和更快的问题定位。
其中,用户体验监控关注用户在使用苏宁服务时的感知,通过监控页面加载速度、交互响应时间等关键指标,及时发现并优化性能问题。服务端调用链监控则跟踪服务之间的调用关系,帮助理解系统的依赖结构,以便在出现问题时快速定位故障源。智能告警引擎利用机器学习技术,自动识别异常模式,减少误报,提高告警的精准度。实时日志分析平台能够迅速处理海量日志数据,提供实时的业务洞察和故障排查线索。
未来,苏宁的监控蓝图将更加侧重于AIOps(人工智能运维)能力的建设,通过智能化手段提升监控效率,预测和预防潜在的问题,实现运维的自动化和智能化,以应对日益复杂的业务和技术环境。这将进一步增强苏宁在信息技术领域的竞争力,确保其在电商大促等关键时期能够提供稳定、高效的用户体验。
2023-08-04 上传
2023-08-17 上传
2023-06-02 上传
2023-08-20 上传
2024-09-26 上传
2023-03-25 上传
2024-06-07 上传
良月二十三
- 粉丝: 76
- 资源: 174
最新资源
- zlib-1.2.12压缩包解析与技术要点
- 微信小程序滑动选项卡源码模版发布
- Unity虚拟人物唇同步插件Oculus Lipsync介绍
- Nginx 1.18.0版本WinSW自动安装与管理指南
- Java Swing和JDBC实现的ATM系统源码解析
- 掌握Spark Streaming与Maven集成的分布式大数据处理
- 深入学习推荐系统:教程、案例与项目实践
- Web开发者必备的取色工具软件介绍
- C语言实现李春葆数据结构实验程序
- 超市管理系统开发:asp+SQL Server 2005实战
- Redis伪集群搭建教程与实践
- 掌握网络活动细节:Wireshark v3.6.3网络嗅探工具详解
- 全面掌握美赛:建模、分析与编程实现教程
- Java图书馆系统完整项目源码及SQL文件解析
- PCtoLCD2002软件:高效图片和字符取模转换
- Java开发的体育赛事在线购票系统源码分析