时间序列新表示模型与相似度检测

0 下载量 138 浏览量 更新于2024-07-14 收藏 8.06MB PDF 举报
“快速,准确的相似度检测:新的时间序列表示模型与相似度度量” 这篇研究论文探讨了在时间序列数据挖掘中快速且准确的相似性检测问题。作者是来自南京航空航天大学计算机科学与技术学院的张妙妙和皮德昌。该研究受到了中国国家自然科学基金(编号U1433116)和中央高校基本科研业务费(编号NP2017208)的资助,并于2017年9月24日提交,10月16日被接受,最终在10月20日发表,并于11月28日发布了当前版本。 文章的核心在于提出两种新颖的方法来优化时间序列的相似性检测。首先,他们介绍了一种新的时间序列表示模型以及与其配套的相似度度量,称为碎片对齐距离(Fragment Alignment Distance, FAD)。这个模型旨在通过更有效地表示时间序列数据,从而提高相似性检测的效率和准确性。在传统的表示方法中,时间序列可能由于其长度和复杂性而难以处理,但FAD通过将序列分解为更小的片段,然后计算这些片段之间的对齐距离,解决了这个问题。 其次,论文还应用了动态时间扭曲(Dynamic Time Warping, DTW)技术来处理时间序列的相似性检测。DTW是一种经典的时间序列比较算法,它允许两个序列在时间轴上进行非线性对齐,以便更好地匹配它们的局部模式。尽管DTW在许多情况下表现良好,但在处理大规模数据时可能会遇到计算效率的问题。论文可能讨论了如何结合新的时间序列表示模型和DTW,以提升DTW的性能,特别是在大数据集上的应用。 论文的贡献在于为时间序列分析提供了一种新的框架,不仅提高了检测相似性的速度,而且保证了结果的准确性。这在各种领域如金融、医疗、信号处理、生物信息学等具有广泛应用价值,因为这些领域常常涉及大量时间序列数据的分析和比较。通过使用FAD和改进的DTW,研究人员和工程师可以更快地识别出时间序列中的相似模式,从而做出更有效的决策或预测。 这篇论文深入研究了时间序列数据的表示和相似性度量,提出的新模型和方法为时间和空间效率的平衡提供了新的解决方案,对于时间序列数据挖掘领域有着重要的理论和实践意义。