多变量时间序列异常识别与分类的深度探究

2星 需积分: 33 55 下载量 113 浏览量 更新于2024-07-22 2 收藏 752KB PDF 举报
"这篇博士学位论文主要探讨了多变量时间序列的异常识别与分类问题,作者为翁小清,导师为沈钧毅教授,研究受到国家自然科学基金和河北省科技攻关项目的资助。论文关注的领域包括金融、医学、多媒体、语音识别等应用广泛的多变量时间序列分析。" 在多变量时间序列(MTS)的异常识别方面,论文首先指出传统的单变量时间序列异常检测方法在处理多变量数据时的局限性。为解决这一问题,论文提出了一种基于扩展Frobenius范数和K-均值聚类的MTS例外模式识别方法。这种方法利用扩展Frobenius范数来衡量两个MTS子序列之间的距离,同时通过成本函数(如重构误差或Hotelling T2度量)评估子序列内部的相似性。通过自底向上的分割算法,MTS被分解为互不重叠的子序列,随后使用K-均值聚类将这些子序列归类,形成模式集合。最后,依据例外模式的定义,从聚类结果中挑选出异常模式。实验证明,这种方法能够有效识别出MTS中的有意义例外模式。 在MTS异常样本的识别上,论文也提出了创新性的解决方案。异常样本是指在多变量时间序列样本集中与其他样本差异显著的样本。由于单变量方法在此领域的局限性,论文引入了一种基于SolvingSet的MTS异常样本识别方法。这种方法可能涉及到对MTS的特征提取、异常度量构建以及异常检测阈值的确定,旨在更准确地发现MTS数据集中的异常实例。 此外,论文还涉及到了不和谐子序列的识别,这是异常检测过程中的一个重要环节。不和谐子序列是指在时间序列中与整体趋势或模式显著偏离的部分,它们可能是异常事件的信号。识别这些子序列有助于深入理解数据的内在结构,并可能揭示潜在的问题或异常情况。 在MTS的分类研究中,论文可能探讨了如何利用机器学习或深度学习算法对多变量时间序列进行有效的分类。这可能包括特征选择、模型训练、性能评估等多个步骤,旨在提高MTS数据的分类准确性。 这篇论文为多变量时间序列的异常识别和分类提供了理论基础和实用方法,对于处理复杂、多维度的时间序列数据分析具有重要的实践价值和理论意义。其研究成果可应用于各种领域,如金融风险预警、医疗诊断、多媒体分析和语音识别系统的改进等。