多变量时间序列异常识别与分类研究

需积分: 33 41 下载量 139 浏览量 更新于2024-08-09 收藏 752KB PDF 举报
"这篇博士学位论文主要探讨了多变量时间序列的异常识别与分类问题,由申请人翁小清在计算机科学与技术领域完成,导师为沈钧毅教授。研究得到了国家自然科学基金和河北省科技攻关项目的资助。论文关注的是如何在多变量时间序列(MTS)中发现异常模式和异常样本,并进行了不和谐子序列的识别和MTS的分类方法研究。" 在数据挖掘领域,时间序列挖掘是一个重要且具有挑战性的研究方向,尤其在多变量时间序列(Multivariate Time Series, MTS)的情况下。MTS广泛存在于金融、医学、语音识别等多个领域,它是由多个变量在不同时间点的观测值组成的矩阵。例如,股票市场可以用多个变量(如开盘价、收盘价等)描述,手势识别可以用传感器数据形成多变量序列,而医学研究中则可能涉及脑电图或心电信号的多变量序列。 MTS异常识别与分类是关键问题,因为异常可能是有价值的信号,如金融市场的异常交易、医疗健康领域的疾病征兆等。论文提出了一种基于扩展Frobenius范数和K-均值聚类的MTS例外模式识别方法。这种方法首先利用扩展Frobenius范数计算子序列间的距离,然后通过成本函数评估子序列内部的同质性,使用自底向上的分割算法分割MTS,最后通过K-均值聚类找到模式集合,从中识别出异常模式。这种方法在实际数据集上显示了有效识别MTS例外模式的能力。 此外,论文还涉及MTS异常样本的识别,它针对那些在MTS样本集中显著不同于其他样本的个体。为解决此问题,论文提出了一种基于SolvingSet的MTS异常样本识别方法,尽管现有的单变量异常识别方法难以直接应用到多变量场景,但此方法能适应MTS的复杂性。 论文的研究对于提升MTS的处理效率,有效提取其中蕴含的信息,以及应对大数据时代下的复杂数据分析挑战具有重要意义。通过深入研究和开发新的算法,学者们可以更好地理解和解释多变量时间序列,从而推动相关领域的科技进步。