基于扩展Frobenius范数的多变量时间序列异常识别与应用

需积分: 33 41 下载量 69 浏览量 更新于2024-08-09 收藏 752KB PDF 举报
本篇文档主要介绍的是"实验结果 - redboot中文手册"中关于多变量时间序列(MTS)异常识别与分类的研究。研究由翁小清博士在计算机科学与技术学科领域进行,受到了国家自然科学基金(编号60673087)和河北省科技攻关项目的资助。 首先,研究集中在两个实际数据集的应用上:上海证券交易所股票交易数据集和BCI脑电图数据集。股票交易数据集包含六个变量,如开盘指数、高指数、收盘指数、低指数、成交量和成交金额,时间跨度从2001年至2005年,共计1075个交易日。为了便于分析,只展示了收盘指数和成交金额的变化趋势。BCI数据集则包含416个28维的MTS,每段数据长度为500。 文章的核心内容分为两部分: 1. MTS例外模式的识别:针对MTS的特性,现有的单变量时间序列异常识别方法不易推广。研究者提出了一个基于扩展Frobenius范数和K-均值聚类的方法。这种方法通过计算MTS子序列间的距离,使用重构误差或Hotelling T2度量评估内部一致性,并利用自底向上的分割算法划分子序列。随后,通过K-均值聚类将这些子序列分组,从而识别出异常模式。实验结果显示,这种方法能有效识别MTS中的有意义异常模式。 2. MTS异常样本的识别:在MTS数据集中,与其它样本显著不同的样本被视为异常样本。鉴于单变量异常识别方法的局限性,论文提出了一种基于SolvingSet的MTS异常样本识别方法。这种方法专门针对MTS的复杂性,旨在找出那些与其他样本明显不同的样本。 这篇论文深入探讨了如何在多变量时间序列中有效地检测和分类异常,为金融、医学等领域的数据分析提供了有力的工具和技术支持。通过实际数据集的验证,证明了研究方法的有效性和实用性。