DTSRE:云端智能运维的探索与实践
需积分: 5 153 浏览量
更新于2024-06-21
收藏 5.88MB PDF 举报
"藏经阁-DTSRE:云端智能运维实践.pdf"
这篇文档主要探讨了云端智能运维的实践,由阿里云相关领域的专家进行讲解。首先,文档提到了SRE(Site Reliability Engineering)的起源,它起源于谷歌2003年,并在2007年被阿里巴巴技术保障部引入,其职责不仅仅是底层硬件维护,而是更侧重于确保服务的稳定性和性能。SRE涵盖了运维管理(ITOM)、运维分析(ITOA)以及智能运维(AIOPS)等不同层面,涉及日常基础架构的管理、事件处理、系统行为分析以及通过人工智能进行故障预测。
接着,文档阐述了SRE面临的业界趋势。新技术的快速发展导致技术架构变得日益复杂,同时云平台的普及使得运维环境更为复杂。DevOps文化的兴起促使人们重新审视运维的价值,而随着互联网创新和快速迭代,业务调整对运维提出了更高要求。此外,安全事件的频发也要求运维人员关注网络安全。大数据的应用则为智能运维提供了新的可能,如利用数据进行故障预测。
进入云时代,虽然云计算提供了基础运维、监控和高可用性的支持,但仍然需要SRE的角色来应对复杂的云环境。这里引用了Oracle CTO Larry Ellison关于“自治数据库”的例子,强调了自动化和智能化在减少人力成本、提升系统稳定性和持续运行能力方面的重要性。
DTSRE(Data-driven Site Reliability Engineering)是基于大数据的智能运维,目标是实现运维的自治化。DTSRE的构建需要三个核心要素:数据采集,涵盖各种基础数据;计算平台,支持实时和离线的大数据分析;以及应用场景,对运维场景有深入理解。这意味着运维工作将更加依赖数据驱动和智能化手段。
这份文档揭示了SRE在云环境中的角色转变,以及如何通过DTSRE将运维工作推向数据化、智能化的新阶段。随着技术的发展,运维工程师需要不断适应新的挑战,掌握大数据和人工智能技术,以实现更高效、更可靠的运维管理。
2023-09-05 上传
2023-08-31 上传
点击了解资源详情
2023-09-09 上传
2023-08-26 上传
weixin_40191861_zj
- 粉丝: 84
- 资源: 1万+
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜