京东运维升级:2.0容器集群实现部署弹性与故障管理
需积分: 10 119 浏览量
更新于2024-08-07
收藏 2.2MB PDF 举报
本文档主要讨论了2.0版本的容器集群部署与运维策略,聚焦于提升部署的灵活性、弹性和负载均衡管理。随着京东应用运维的智能化演进,团队面临的问题包括传统的运维方式效率低下、缺乏标准化流程、部门间协作困难以及技术栈多样性带来的挑战。通过引入Docker和Kubernetes等容器技术,容器集群架构被设计为鲍永成架构师分享中的核心组件,其中包括OVS(Open vSwitch)用于网络虚拟化、LB(负载均衡器)进行流量分发、SDN(Software-Defined Networking)实现自动化网络配置。
在2.0容器集群中,关键要素包括:
1. **部署与弹性**:通过自动化部署工具,如统一的系统化容器管理和镜像预测,实现了部署过程的标准化和预测性,提升了部署效率。同时,弹性体现在对服务器故障的处理上,视作正常事件,自动报修和业务转移能力的增强。
2. **弹性数据库(JimDB)和存储**:JimDB作为Key/Value存储解决方案,与JFS数据存储共同支持业务系统的数据需求,确保高可用性和扩展性。
3. **运维工具**:引入智能运维理念,强调平台化、自动化和智能化运维,如监控系统和日志管理,旨在提高运维效率并降低故障对业务的影响。
4. **业务系统集成**:所有运维活动都是为了保障业务系统的正常运行,通过整合资源(如容器资源、DB资源和存储资源),确保业务方、研发和运维团队能够获得稳定且充足的资源。
5. **变更与发布管理**:关注镜像在不同环境间的流转,以及开发、测试、预发布和生产环境的无缝衔接,减少“搭车”上线的风险。
6. **故障管理和冗余**:通过“响尾蛇系统”,实现了故障的隔离和快速响应,提高故障冗余,确保业务连续性。
7. **容器集群架构**:基于Docker和Kubernetes构建的架构,结合SDN技术,提供了灵活、高效的基础设施支持。
8. **运维交付目标**:最终的目标是向业务方交付稳定的系统,通过监控、报警机制和故障演练来确保这一目标的实现。
在整个运维体系中,运维单位被重新定义为资源管理者,而不再局限于硬件层面,强调资源的充足、冗余以及整体环境的稳定性。此外,文档还提到了一些内部团队如IDC资源集群、控制模块和权限管理等具体操作细节,以及与BMT(可能是指某个内部项目或工具)的集成,以确保运维工作的全面性和高效性。
2021-10-10 上传
2021-09-29 上传
2020-08-08 上传
2020-02-03 上传
点击了解资源详情
2022-07-14 上传
2022-03-11 上传
2022-09-24 上传
史东来
- 粉丝: 42
- 资源: 4027
最新资源
- 掌握Jive for Android SDK:示例应用的使用指南
- Python中的贝叶斯建模与概率编程指南
- 自动化NBA球员统计分析与电子邮件报告工具
- 下载安卓购物经理带源代码完整项目
- 图片压缩包中的内容解密
- C++基础教程视频-数据类型与运算符详解
- 探索Java中的曼德布罗图形绘制
- VTK9.3.0 64位SDK包发布,图像处理开发利器
- 自导向运载平台的行业设计方案解读
- 自定义 Datadog 代理检查:Python 实现与应用
- 基于Python实现的商品推荐系统源码与项目说明
- PMing繁体版字体下载,设计师必备素材
- 软件工程餐厅项目存储库:Java语言实践
- 康佳LED55R6000U电视机固件升级指南
- Sublime Text状态栏插件:ShowOpenFiles功能详解
- 一站式部署thinksns社交系统,小白轻松上手