基于预测的时间序列惊奇模式发现算法

需积分: 5 0 下载量 65 浏览量 更新于2024-08-12 收藏 265KB PDF 举报
"发现时间序列数据中的高质量惊奇模式 (2007年) - 李爱国,李战怀 - 西北工业大学学报" 在时间序列分析领域,惊奇模式(Surprising Pattern)的发现是一项关键任务,它对于趋势预测、异常检测和实时监控等领域有着重要的应用。现有的惊奇模式发现算法主要依赖于时间序列的形态特征,但这种方法往往忽略了时间序列的内在机制和统计特性,导致可能发现无实际意义的“惊奇模式”。 李爱国和李战怀在2007年的研究中提出了一种基于时间序列预测的新定义来识别惊奇模式。他们认为,如果一个时间序列是可以预测的,那么惊奇模式就是那些超出预期、无法准确预测的子序列。这种定义更贴合人们对惊奇模式的理解,同时也利用时间序列预测的方法来探索隐藏在数据中的规律。 研究中,他们首先将原始的时间序列离散化为0和1组成的字符串,0代表正常值,1代表异常或例外事件。接着,通过一个简单算法从这个字符串中寻找所有的惊奇模式。这种方法的优点在于能够有效区分有意义的惊奇模式和无意义的模式,减少了误报的可能性。 实验部分,研究人员使用了火电厂胶带输煤机实时煤流监测数据来验证提出的算法。结果显示,该算法不仅能够发现类似于Keogh等人定义的惊奇模式,而且能够避免发现无实际意义的模式,体现了其在实际应用中的价值和有效性。 这项工作为时间序列数据分析提供了一个新的视角,强调了预测性在定义和发现惊奇模式中的重要性,为时间序列数据的异常检测和理解提供了更深入的方法。通过这样的算法,可以更好地理解和应对复杂系统中可能出现的不可预见事件,从而有助于提升系统的稳定性和安全性。