魅族运维架构师分享:持续交付平台建设实践

需积分: 5 0 下载量 85 浏览量 更新于2024-06-21 收藏 2.03MB PDF 举报
“魅族持续交付平台建设.pdf是GOPS全球运维大会2017·北京站上关于魅族公司构建持续交付平台的主题分享。主讲人李恒,曾任金山软件开发经理,现担任魅族的运维架构师,负责魅族云平台的虚拟化和基础设施监控等研发工作。” 在此次分享中,李恒首先介绍了魅族互联网业务的发展历程,从互联网1.0到3.0+,伴随着技术的演进,魅族的架构也在不断升级。随着业务的快速发展,运维团队面临的挑战日益增加,包括频繁的“救火”、“填坑”和“背锅”。为了解决这些问题,提升运维的价值,魅族开始重视运维的质量、效率、成本和安全性。 李恒详细阐述了魅族运维平台的现状,包括一套完整的配置管理系统,如堡垒机、漏洞管理系统、自研WAF系统等。此外,还有基础监控、自定义监控、业务监控、容量系统以及一系列的自动化工具,如LVS、CDN、DNS管理、工单系统、日志系统、发布系统、应用管理系统、自研运维通道和自动巡检系统。在基础设施层面,KVM和Docker的使用增强了虚拟化能力,同时CMDB(配置管理数据库)和资源管理系统确保了高效运作。 魅族的发布平台经历了从周发布到日发布,再到自助发布的演变。发布类型涵盖了多种技术栈,如Jetty、Task、Static、Kiev、NodeJS、PHP和C++。通过多样化的发布策略,包括组发布、自助发布和一键重启,发布成功率得到了显著提升,自助发布率和自助审核率也稳步增长。 最后,李恒提到了交付流程,强调了开发、测试和运维之间的紧密协作。测试人员进行验证,运维人员提供自动部署服务,确保日志收集、报警监控和应用快速扩容的顺利进行,而开发人员则负责代码编写和功能实现。 魅族的持续交付平台建设围绕着自动化、监控、管理和协作展开,旨在提高运维效率,降低风险,并通过持续优化发布流程,推动开发和运维的无缝对接,实现更高效的业务迭代。这一平台的建设对于其他企业来说具有很好的参考价值,展示了如何通过技术创新和流程改进来应对互联网行业的快速变化。