唯品会运维实践:从ITIL到SRE的自动化转型
需积分: 5 29 浏览量
更新于2024-06-21
收藏 1.9MB PDF 举报
"《藏经阁-从ITIL走向SRE--唯品会运维自动化实践》一文主要探讨了唯品会在IT运维领域的发展历程和实践经验。该演讲由王喜春,一位高级运维开发经理,在2017年的GOPS全球运维大会北京站上分享。文章首先回顾了唯品会在2013年面临的技术挑战,当时公司业务快速发展,服务节点众多,订单量巨大,对运维系统的稳定性和效率提出了高要求。
在这个背景下,唯品会引入了ITIL(信息技术基础设施库)作为运维的核心框架,建立起一套包括发布流程、变更流程、故障处理流程和问题追踪流程在内的管理体系,并开发了相应的系统支撑。ITIL强调流程驱动,先有明确的流程再设计系统,以流程改进为核心,通过PDCA(Plan-Do-Check-Act)循环持续优化。
然而,ITIL的局限在于它是管理思想的体现,侧重于人为控制和责任分配,对于大规模自动化的需求可能显得不够灵活。随着业务规模的扩大,唯品会开始尝试将运维自动化引入SRE(Site Reliability Engineering)理念,关注如何确保应用依赖关系的准确管理和线上质量的可控性。
例如,文章通过实例阐述了发布流程的严谨性,如规定每周三、四为发布日,周一、二为代码合并窗口,周二、三进行回归测试,以及严格的代码权限控制机制,以保证发布的安全性和质量。同时,对巡检报告的发送责任也进行了明确,这体现了ITIL实践中对责任和透明度的重视。
文章还提到,随着对SRE的理解深入,唯品会开始寻求在故障发生后的自动化响应,通过系统来统计和分析运维数据,而不是单纯依赖人工。这种转变旨在提升运维效率,减少人为错误,实现运维质量的可控性和自动化。
该篇文章揭示了唯品会从传统的ITIL管理框架向更现代化、自动化运维模式的转变过程,以及在这个过程中所面临的挑战与收获,为其他企业提供了有价值的运维转型参考案例。"
2019-08-28 上传
2021-10-12 上传
点击了解资源详情
2021-08-21 上传
点击了解资源详情
2021-12-17 上传
2021-09-17 上传
weixin_40191861_zj
- 粉丝: 83
- 资源: 1万+
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析