自动化运维:从初始化到未来
需积分: 9 138 浏览量
更新于2024-07-10
收藏 3.3MB PPT 举报
"自动化运维在新浪的研发动态平台团队中扮演着至关重要的角色,旨在减少人工操作,提高效率。"
在现代的IT环境中,"初始化-自动化运维"已经成为提升效率和服务质量的关键。新浪的研发团队,以邹立巍为代表,面对的是一个庞大的基础设施,包括13个IDC(互联网数据中心)、90%的服务器利用率、400项服务、5000台服务器以及每天处理的100亿次点击。这个规模的运维工作量巨大,涵盖了从Apache、Mysql、Squid、Memcache到Redis等一系列关键服务。
在传统的运维工作中,"苦逼的系统初始化"是一个痛点。每次系统部署或更新都需要手动进行大量的配置文件维护、脚本编写和代码分发,这不仅耗时,还容易出错,往往导致运维人员不得不加班处理。因此,如何通过自动化手段来解决这个问题,让"系统初始化"变得更为高效,成为了一个亟待解决的问题。
"悲催的系统环境维护"涉及到了配置管理工具的选择,如cfengine和puppet,它们可以自动化管理配置文件,但选择哪种工具更适合,需要根据实际需求和技术栈来决定。此外,脚本程序的维护应该与配置文件保持独立还是紧密集成,也是一个需要权衡的决策。同时,代码分发的自动化也是优化运维流程的重点,目标是尽可能地减少人工干预。
对于"万恶的状态监控",新浪团队使用了Exmon(Ganglia)这样的工具,它可以实时监控系统状态,但仅仅依靠短信和邮件的报警方式可能不足以应对复杂的问题,需要更强大的故障响应和处理机制。"由ABCD到Webshell"的过程揭示了运维工具的演进,从早期的命令行工具(如ABCD,可能是对AIX、BSD、Cisco、Linux等的缩写)到利用expect自动化脚本,再到通过xinetd实现服务管理和webshell实现远程管理,这些都反映了运维自动化程度的不断提升。
未来的趋势是"MoreServer, LessOperation",即在服务器数量持续增长的同时,通过自动化运维减少人为操作,减轻运维人员的工作负担。这表明,新浪将继续探索和发展更先进的自动化运维策略,以适应日益复杂的IT环境,并确保服务的稳定和高效运行。
自动化运维是解决大规模系统管理问题的有效途径,它不仅可以提高运维效率,还能降低错误率,是IT行业中不可或缺的技术趋势。新浪的研发动态平台团队正在通过不断的实践和创新,推动这一领域的进步。
2019-09-02 上传
2021-09-30 上传
2011-07-15 上传
2015-05-14 上传
点击了解资源详情
2015-04-08 上传
2019-08-13 上传
2021-10-14 上传
2019-05-22 上传
VayneYin
- 粉丝: 23
- 资源: 2万+
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载