基于扩展Frobenius范数的多变量时间序列异常识别方法

需积分: 33 41 下载量 107 浏览量 更新于2024-08-09 收藏 752KB PDF 举报
"这篇博士学位论文是关于多变量时间序列(MTS)异常识别与分类的研究,由申请人翁小清在沈钧毅教授指导下完成。论文主要关注三个方面:MTS例外模式的识别、异常样本的识别以及不和谐子序列的识别,并探讨了MTS的分类问题。该研究得到了国家自然科学基金和河北省科技攻关项目的资助。 1) MTS例外模式识别方面,论文提出了一种创新方法,利用扩展Frobenius范数和K-均值聚类来识别异常模式。这种方法首先通过基于重构误差或Hotelling T2度量的成本函数描述MTS子序列的同质性,然后使用自底向上的分割算法对MTS进行分割,形成互不重叠的子序列。接着,运用扩展Frobenius范数计算子序列间的距离,并通过K-均值聚类将子序列归类。最后,根据例外模式的定义,从这些类别中找出异常模式。实验证明,这种方法在两个实际数据集上能有效识别MTS的例外模式,并且与已有的单变量时间序列识别方法进行了对比分析。 2) MTS异常样本识别方面,论文提出了一种基于Solving Set的方法。此方法使用扩展Frobenius范数衡量MTS样本间的距离,通过k-近邻样本的距离之和计算异常得分,构建Solving Set以降低时间复杂度。与Karioti等人提出的单变量异常样本识别方法相比,新方法有三个优势:可识别出数据集中前num个异常样本,对样本长度无特定要求,适用于不同长度的中大型数据集,且可扩展到单变量时间序列数据集。实验显示,该方法在两个实际数据集上表现出高效性和准确性。 3) MTS不和谐子序列识别部分,论文开发了一种改进的Solving Set算法。该方法通过滑动窗口提取子序列,计算协方差矩阵的奇异值和右特征向量,再用扩展Frobenius范数计算子序列间距离,并针对原Solving Set的不足进行了优化,降低了时间复杂度。此方法将MTS子序列作为一个整体处理,提升了对MTS各变量的综合分析能力。 该研究为多变量时间序列异常检测提供了新的理论和技术,对于金融、医学、多媒体和语音识别等领域有着重要的应用价值。"