微信运维高效实践:云化、弹性与自动化
需积分: 5 50 浏览量
更新于2024-06-21
收藏 4.3MB PDF 举报
在《藏经阁-微信高效运维之路.pdf》这份文档中,作者吴磊分享了他在2017年GOPS全球运维大会北京站上的演讲内容,重点关注了微信运维实践中的关键环节。首先,他讨论了弹性伸缩的自动化管理,强调了效率与成本的关系,指出服务伸缩不仅是运维工程,而且需要独立于研发的变更发布流程。文档中提到了云化管理的重要性,包括容量管理和自动调度,通过这些方法,微信能够实现对资源的精细化控制。
在配置文件管理方面,规范化的目录结构被严格执行,确保跨服务、不同实例和环境(如开发、测试和现网)的配置一致性,同时强调了同一服务版本在所有环境下的配置文件MD5一致性,保证服务的稳定性和一致性。
此外,文档还着重介绍了微信的数据存储规范,划分了接入层、逻辑层和存储层,明确了数据的流动规则,例如接入层不存储数据,逻辑层带有短周期缓存和静态数据,而存储层则负责长期缓存和数据落地。对于服务的伸缩性,特别是接入层和逻辑层,由于数据关系相对简单,无需担心数据迁移和缓存命中率问题。
运营规范是文档的核心部分,目标是使服务变得可运维,并通过变更系统拦截、全网扫描不规范的服务来实现。针对不同的服务部署情况,如独占物理机、混合部署等,微信选择将微服务、资源占用和变更频率作为决策因素,采用Cgroup进行虚拟机型定制和物理机资源分片。
尽管线上并未全面启用Docker,但svrkit框架实现了100%覆盖,提供了标准化和规范化,同时对比了非侵入式vsDocker侵入式的利弊。此外,文档还提到了私有云调度系统的自研情况,该系统借鉴了borg、yarn、k8s和mesos等主流调度系统的优点,覆盖了大部分微服务,并设计了相应的架构。
云化管理小结中,明确了阶段目标,即实现服务间的资源隔离,这是提升整体运维效率和系统稳定性的重要步骤。这份文档深入探讨了微信如何通过规范化、自动化和标准化的运维策略,提升其在云计算环境下的运维效能。
weixin_40191861_zj
- 粉丝: 87
- 资源: 1万+
最新资源
- Applied-ML-Algorithms:一个采用泰坦尼克号数据集并在scikit-learn和超参数调整中使用不同ML模型的ML项目
- Spring_2021
- Tolkien
- cot_tracker:交易者数据追踪器的承诺
- http-factory-diactoros:为Zend Diactoros实现的HTTP工厂
- 酒保:酒保-PostgreSQL备份和恢复管理器
- tpwriuzv.zip_归一化时域图
- TPF U13
- TicTaeToeOnline
- Large-scale Disk Failure Prediciton Dataset-数据集
- aim-high:用于设置和跟踪目标的应用
- c#飞机大战期末项目.rar
- Becross
- nrmgqpyn.zip_complex cepstrum
- 适用于Android NDK的功能强大的崩溃报告库。 签出后不要忘记运行git submodule update --init --recursive。-Android开发
- 弹跳旋转器::globe_with_meridians::bus_stop:一个显示弹跳旋转器的Web组件