腾讯运维专家分享:复杂业务自动化运维实践
版权申诉
143 浏览量
更新于2024-07-17
收藏 4.35MB PDF 举报
"4. max--复杂业务的自动化运维精髓V2.pdf"
这篇文档主要讲述了腾讯运维体系在处理复杂业务时的自动化运维策略,重点强调了自动化运维的重要性以及如何通过各种工具和技术提升运维效率和质量。在全球运维大会2018深圳站中,腾讯QQ平台的运维负责人杨利东分享了他们的运维故事。
首先,文档提到了IAAS(基础设施即服务),包括硬件设施、网络设备、服务器、机房设施、CDN、虚拟化等,这些都是构建运维体系的基础。CMDB(配置管理数据库)则用于管理所有IT资源的配置信息,如软件包、配置文件、权限记录等,确保资源的有序和一致。
在自动化运维方面,文档介绍了织云平台的API层,它提供了对各种运维操作的接口支持,使自动化成为可能。监控体系是运维中的关键,包括用户端监控、组件监控、基础监控等,用于实时掌握系统的运行状态。此外,还提到了自动化运维的一些具体实践,如无人运维、灰度发布、持续部署等,这些都是通过自动化工具和流程实现的。
文档还讨论了在面对快速发展的业务和多变的需求时,如何应对运维挑战。例如,QQ平台在特殊事件(如全民“致青春”晒照片、春节红包活动)期间,需要迅速扩容和调整资源,这需要强大的自动化运维能力作为支撑。
在运维流程和服务方面,提到了事件管理、变更管理、发布管理、资源管理和KPI预测,这些流程保证了运维的标准化和效率。同时,引入了容器服务、TSF(腾讯服务框架)、TDSQL等技术,用于提高服务的可扩展性和可靠性。
AIOPS(智能运维)是未来运维的一个重要方向,文档提到了AI算法在关联分析、根因分析和舆情监控中的应用,通过数据驱动的方式提升运维的智能化水平。此外,还有通知中心、日志中心、场景化管理和智能客服等工具,进一步完善了运维的响应机制和用户体验。
最后,织云一体化运维平台被提及,这是一个整合了多种运维工具和功能的平台,实现了运维工作的场景化管理,旨在通过统一的界面和流程提升整体运维效能。
这篇文档深入探讨了腾讯在面对复杂业务时如何通过自动化运维、智能化工具和标准化流程,实现高效、可靠的运维管理,为其他企业的运维工作提供了宝贵的实践经验。
2019-10-08 上传
2023-02-11 上传
2022-04-19 上传
2022-02-18 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
申伟鹏
- 粉丝: 0
- 资源: 1430
最新资源
- MATLAB实现小波阈值去噪:Visushrink硬软算法对比
- 易语言实现画板图像缩放功能教程
- 大模型推荐系统: 优化算法与模型压缩技术
- Stancy: 静态文件驱动的简单RESTful API与前端框架集成
- 掌握Java全文搜索:深入Apache Lucene开源系统
- 19计应19田超的Python7-1试题整理
- 易语言实现多线程网络时间同步源码解析
- 人工智能大模型学习与实践指南
- 掌握Markdown:从基础到高级技巧解析
- JS-PizzaStore: JS应用程序模拟披萨递送服务
- CAMV开源XML编辑器:编辑、验证、设计及架构工具集
- 医学免疫学情景化自动生成考题系统
- 易语言实现多语言界面编程教程
- MATLAB实现16种回归算法在数据挖掘中的应用
- ***内容构建指南:深入HTML与LaTeX
- Python实现维基百科“历史上的今天”数据抓取教程