基于局部稀疏系数的多变量时间序列异常样本检测方法

需积分: 10 8 下载量 13 浏览量 更新于2024-11-27 收藏 256KB PDF 举报
本文主要探讨了多变量时间序列(Multivariate Time Series, MTS)在金融、多媒体和医学等领域广泛应用背景下,针对其中的异常样本(Outlier Samples)检测问题。MTS异常样本指的是与其他正常样本有显著差异的数据点,它们的存在可能对数据分析和模型预测产生负面影响。 作者翁小清和沈钧毅提出了一个新颖的算法,该算法的核心是基于局部稀疏系数(Local Sparsity Coefficient)来识别异常样本。局部稀疏系数是一种用于衡量MTS数据集中每个时间点相对于其邻域内的其他点的稀疏度的方法,这对于捕捉异常数据中的非线性和局部特征非常有效。 为了比较两个MTS样本之间的相似性,作者引入了扩展的Frobenius范数(Extended Frobenius Norm),这是一种在高维空间中度量矩阵距离的常用方法,它能够有效地处理多变量时间序列数据的结构特性。通过这种方式,算法可以有效地评估样本间的异同,并区分正常与异常模式。 识别过程采用两阶段顺序查询策略来进行k近邻查找(K-Nearest Neighbors, KNN)。这个策略首先排除那些不可能成为异常样本的MTS,从而提高了搜索效率和准确性。这种方法减少了计算复杂性,对于大规模MTS数据集尤其适用。 实验证明,该算法在两个实际数据集上的应用取得了满意的效果,能够准确地识别出异常样本,验证了算法的有效性和实用性。研究的关键词包括多变量时间序列、局部稀疏系数、扩展的Frobenius范数以及异常样本,这些关键词都突出了文章的核心贡献和技术路线。 总结来说,本文提供了一种创新的方法,通过结合局部稀疏系数和扩展Frobenius范数,有效地解决了多变量时间序列异常样本识别的问题,为相关领域的数据分析提供了有力工具。对于需要处理和分析多维度时间序列数据的领域,如金融风险监控、视频异常检测或医疗诊断,这一研究成果具有重要的实际应用价值。