京东微信手Q运维平台的演进与重构

0 下载量 34 浏览量 更新于2024-08-30 收藏 546KB PDF 举报
"京东微信手Q运维体系概览" 京东微信手Q运维体系的构建,源于几年前的一次业务融合,这次融合促使后端IT能力的整合。由于系统间的依赖性和运行环境的差异,原有的运维平台在系统迁移后无法正常工作,因此在保持原有发布模式不变的前提下,需要重建一套适应新环境的运维体系。这一需求随着业务的扩张而不断增长。 在融合过程中,保留了四个关键组件:发布部署系统、业务调度、DB需求与执行平台以及配置中心。然而,这带来了两大挑战:一是运行环境的差异需要对所有系统进行修改和重编译以确保在新平台上的稳定性;二是发布部署系统依赖CMDB来管理设备和业务的关系,从而控制发布流程。 为了应对这些挑战,京东团队花费两年时间重构了关键路径,构建了一个新的运维体系框架。这个框架主要包括以下几个部分: 1. CMDB(配置管理数据库):作为资源管理系统,记录设备与业务、设备与人的关系,以及设备的生命周期和状态。通过与RPM包发布的联动确保数据准确性,重建的目标是业务型CMDB。 2. 配置中心:保留下来的关键系统,管理访问路由、DB路由信息,负责负载均衡、业务容灾、基础配置管理、业务间调用、DB路由访问与自动切换等功能。配置中心采用多线程模型,通过配置agent将配置信息实时更新到目标机器的内存中,同时支持白名单功能,实现灰度发布。 3. 调度系统:用于执行设备命令和文件下发,是其他系统执行操作的中枢。它可以配合其他系统完成复杂的运维任务。 4. 其他系统:包括监控、报警、自动化运维工具等,共同构成了一个完整的运维生态。 在这个过程中,京东运维团队积累了丰富的经验,他们优化了系统间的协作,提升了运维效率,同时也增强了系统的稳定性和可扩展性。通过这样的体系设计,京东能够更好地应对微信和手Q业务的快速发展,保证服务的高效稳定运行,同时也为未来的业务创新和拓展奠定了坚实的基础。