腾讯智能监控实践:全链路监测与质量提升
需积分: 10 51 浏览量
更新于2024-07-19
1
收藏 4.16MB PDF 举报
"本次分享来自GOPS2016全球运维大会·深圳站,主题是腾讯的智能监控实践,由腾讯社交平台运维负责人梁定安进行演讲。内容涵盖了监控在腾讯运维中的应用、监控的必要因素、实践案例以及监控系统的全链路覆盖,展示了腾讯在监控领域的深度和广度。"
在腾讯的运维实践中,智能监控扮演了关键角色,旨在确保全链路的稳定性和高效性。监控的目标主要集中在四个方面:质量、效率、成本和用户体验。质量涉及服务的可靠性与可用性,而效率则关乎如何通过监控提升服务运行的效能。成本方面,监控有助于降低因故障导致的经济损失,同时优化资源分配。用户体验是监控的重要考量,因为只有确保用户能够顺畅地使用服务,才能真正体现服务的价值。
监控手段分为被动和主动两种。被动监控是从应用外部探测服务状态,无需额外的埋点工作,但可能无法深入到程序逻辑中。主动监控则是通过提前在应用中埋点,让服务主动报告其运行状况,能更全面地了解服务的内部行为。
监控的本质在于发现趋势、进行对比、识别波动、设置阀值、分析分布和聚类,并且通过图表展示,配合告警机制。理想的监控系统应具备无盲点的覆盖率,确保全面监控;减少误报,提高准确性;以及实时响应,确保告警能快速触达相关人员。
全链路监控包括从运营商网络到用户的整个流程,涵盖ISP、负载均衡、接入层、逻辑层和数据层。腾讯的SNG监控全景图展示了从操作系统、服务器硬件、数据层服务、中间件、Web层、自研服务,直至客户端的全面监控体系,还包括了网络质量、CDN、数据层、业务染色、返回码、测速系统、自动化测试、模块间调用、舆情监控、卡慢监控等多维度的监控模块。
监控的速度也是关键,从数据采集到用户接收到异常告警的时间需要尽可能短,腾讯的目标是在7分钟内完成这一过程,以实现快速响应和问题定位。
腾讯的智能监控实践体现了运维监控的深度集成和智能化,通过全面、精准和实时的监控策略,确保了社交平台的高效稳定运行,为用户提供优质的体验。这样的实践对于其他企业的运维监控体系建设具有重要的参考价值。
2010-03-28 上传
2022-04-19 上传
2023-05-29 上传
2023-04-28 上传
2023-06-01 上传
2023-06-09 上传
2023-09-11 上传
2023-07-14 上传
2023-05-09 上传
雨信康
- 粉丝: 3
- 资源: 34
最新资源
- 新型智能电加热器:触摸感应与自动温控技术
- 社区物流信息管理系统的毕业设计实现
- VB门诊管理系统设计与实现(附论文与源代码)
- 剪叉式高空作业平台稳定性研究与创新设计
- DAMA CDGA考试必备:真题模拟及章节重点解析
- TaskExplorer:全新升级的系统监控与任务管理工具
- 新型碎纸机进纸间隙调整技术解析
- 有腿移动机器人动作教学与技术存储介质的研究
- 基于遗传算法优化的RBF神经网络分析工具
- Visual Basic入门教程完整版PDF下载
- 海洋岸滩保洁与垃圾清运服务招标文件公示
- 触摸屏测量仪器与粘度测定方法
- PSO多目标优化问题求解代码详解
- 有机硅组合物及差异剥离纸或膜技术分析
- Win10快速关机技巧:去除关机阻止功能
- 创新打印机设计:速释打印头与压纸辊安装拆卸便捷性