AIOps落地难?仅需落地难?仅需9步构建一套步构建一套AIOps的最佳实践的最佳实践
我在与客户交流 AIOps 的时候,他们时常觉得 AIOps 不够成熟,以至于无法实施各种分析。
也有人认为:AIOps 的各项能力是线性发展的,他们必须事先评估和补足当前在“处理大量的事件和警报,以及统一化分散监
控”方面的能力成熟度,才能考虑切入 AIOps。
我非常理解他们的关注点,毕竟数十年来,分析师和供应商灌输了僵化的 ITIL 思想和严格的流程,使大家都不愿为那些长期
存在的问题,找到替代的解决方案。
诚然,AIOps 并未直接受到 ITIL 的约束,并能够被分步骤地予以实施和改进,但是业界至今仍缺乏实际的行动指导。
本文通过早、中、后期九个步骤来给出 AIOps 所必要的最佳实践。
AIOps的快速回顾
Gartner 判断的 IT 新兴市场趋势为:传统的 IT 流程与工具已不再适合处理那些由现代数字业务所带来的挑战。这不但与数据
的传输速度、种类、以及体量有关,还与从线下的历史分析转为线上的实时分析有关。
Gartner 对于这种趋势所给出的答案是:AIOps。它整合了 IT 服务管理(ITSM)、IT 运营管理(ITOM)和数据层面上的 IT
自动化。
AIOps 使得数据能够驻留在支持实时应用分析和深度历史查询的大数据平台之中。这些分析可以由那些支持对数据流进行无人
值守式处理的机器学习来实现。
因此 AIOps 的基本思想是:传统的 IT 工具仍然发挥效用,例如服务管理仍然处理各种请求和事件;而性能管理仍然监视各种
指标、事件和日志。
但是它们的数据被关联、并通过机器学习的分析,从而实现更好、更快的决策和任务过程的自动化。
最终状态
AIOps 的最终状态是:要保证数据能够顺畅地从多个数据源流入一个大的数据平台中。
该平台能够对来自其他来源和类型的数据予以吸收、分析和后期处理;通过机器学习来管理和修改分析算法。
它能够自动触发工作流,其输出结果会作为二次数据源被再次反馈到系统之中,使得系统实现自适应,并且通过响应各种数据
卷、数据类型和数据源的变化,进而自动调整和按需通知相应的管理员。
基于上述概念,我将首先提出一个必要且可行的“路线图”,然后详细阐述在 AIOps 实施过程中可采用的具体步骤,以构建出一
套 AIOps 的最佳实践。
该 AIOps 路线图共分为 9 步,他们分别是:
识别当前用例
就系统记录达成一致
确定成功的标准、并着手跟踪它们
评估当前和未来状态的数据模型
分析现有工作流
开始自动化实施
开发新的分析工作流
使组织适应新的技能集
定制各种分析技术