基于Autoencoder和HMM的高效时间序列异常检测方法

版权申诉
13 下载量 195 浏览量 更新于2024-09-10 1 收藏 743KB PDF 举报
本文主要探讨了一种结合Autoencoder(自编码器)和Hidden Markov Model (HMM,隐马尔可夫模型) 的新型时间序列异常检测方法,称为AHMM-AD(Autoencoder and HMM-based Anomaly Detection)。在传统的基于HMM的时间序列异常检测中,符号化方法往往难以充分捕捉原始时间序列的复杂性和细节。为了解决这一问题,研究者提出了AHMM-AD,其流程如下: 1. 预处理与分段:首先,采用滑动窗口技术对时间序列样本进行分割,将每个样本划分为多个连续的子序列,形成多个时间序列分段样本集。 2. 自编码器训练:针对每个分段样本集,训练独立的自编码器,这些自编码器能将输入的时间序列降维到一个低维空间,提取出其内在的非线性特征。 3. 符号化表示:通过k-means聚类算法,对所有低维特征向量进行聚类,将时间序列样本转换为离散的符号序列,使得异常检测更为直观。 4. HMM构建与检测:使用正常时间序列的符号序列集来构建HMM模型。对于待检测的样本,计算它在已建立的HMM模型下的输出概率值,如果这个概率值显著低于正常值,就认为是异常。 在实验部分,AHMM-AD在多个公共基准数据集上的表现优于现有方法。相比于基于HMM的方法,AHMM-AD在精确度、召回率和F1值上分别平均提升了0.172、0.477和0.313;相较于基于Autoencoder的时间序列异常检测模型,AHMM-AD在这三个方面分别有0.108、0.450和0.319的提升。这些结果证明了AHMM-AD在保持高精度的同时,有效地捕捉到了时间序列中的非线性特征,克服了HMM模型在符号化过程中的不足,从而提高了异常检测的准确性和鲁棒性。 总结来说,这篇研究论文创新地融合了自编码器的特征学习能力和HMM的建模能力,为时间序列异常检测提供了一种更有效的策略,对于实际应用中的异常检测任务具有重要的理论价值和实践意义。