"唯品会运维自动化实践:从ITIL到SRE"

需积分: 0 1 下载量 33 浏览量 更新于2023-12-20 收藏 1.91MB PDF 举报
《从ITIL到SRE:唯品会运维自动化实践》是王喜春在2017年G O P S全球运维大会北京站上的分享内容。王喜春是唯品会的高级运维开发经理,他分享了唯品会在过去几年中从传统的ITIL运维模式转向SRE运维自动化的实践经验和心得。 在分享中,王喜春首先介绍了唯品会在2013年所面临的运维挑战和应对情况。当时,唯品会的单日订单均量达到13万,会员数量已经达到5000万,服务节点有8000台,应用服务有130个,全年报障数达到5700。这些庞大的数字意味着唯品会的运维工作面临着巨大的挑战,需要寻求更高效的解决方案。 为了提升运维质量,唯品会采取了一系列措施,其中包括建立以ITIL为核心的运维体系。他们建立了发布流程、变更流程、故障处理流程及问题追踪流程,并且搭建了相应的系统来支持这些流程。通过这些举措,唯品会成功地提升了运维质量,使之成为可控的流程。 然而,随着业务的不断扩张和发展,传统的ITIL运维模式也逐渐暴露出了一些瓶颈和不足。王喜春在分享中指出,ITIL模式在应对日益复杂的业务需求和快速变化的市场环境下已经显得力不从心。因此,唯品会决定尝试引入SRE(Site Reliability Engineering)的理念和实践。 SRE是一种结合软件工程和运维运营的新型运维模式,其核心思想是通过自动化、工程化的手段来提高系统的稳定性和可靠性。王喜春分享了唯品会在引入SRE模式后所取得的一些成果和经验。他指出,通过SRE的自动化实践,唯品会有效地降低了系统的故障率,提高了故障的处理效率,同时也降低了运维成本。 在整个分享中,王喜春还分享了自己的一些个人心得和感悟。他强调了运维工作的重要性和挑战,以及在运维工作中需要不断学习和更新自己的知识和技能。同时,他也鼓励大家要敢于尝试新的技术和方法,不断创新和改进。 总的来说,王喜春在这次分享中向大家展示了唯品会在运维自动化实践方面的经验和成果,以及他个人对于运维工作的理解和认识。这不仅为大家提供了宝贵的实战经验,也激励着大家在自己的工作中不断探索和进步。这次分享无疑为G O P S全球运维大会带来了一场精彩的技术盛宴,也为全球运维领域的发展贡献了一份力量。