改进的时间序列相似性度量:加权夹角距离方法

需积分: 10 0 下载量 67 浏览量 更新于2024-09-06 收藏 481KB PDF 举报
本文主要探讨了"时间序列相似性度量的加权夹角距离方法研究"这一主题,由作者李明亮、陈湘涛和陈玉娟合作完成,分别来自湖南大学计算机与通信学院和中南大学信息科学与工程学院。他们针对传统时间序列角度距离相似性度量方法存在的子线段长度信息丢失问题,提出了一个创新的加权夹角距离度量策略。 在论文中,作者指出传统的线性分段方法虽然直观,但在处理不等长子序列时,角度元素的重要性并未得到恰当反映,因为每个角度代表的信息量与其所对应的子序列长度相关。为解决这个问题,他们引入了权值的概念,将角度元素的权重定义为其相邻子序列长度之和在整个序列中的占比,这样可以确保角度元素的权重与其描述的信息量成正比。这种方法通过角度和权重的结合,将原始时间序列转化为向量形式,从而有效地保留了子序列长度信息,提高了描述的全面性。 加权夹角距离度量方法不仅克服了点距离度量的鲁棒性差和物理概念不清晰的问题,还保留了时间序列的振幅平移、伸缩、线性漂移和时间轴伸缩等变换的不变性。这种方法在实际应用中,例如时间序列的相似性查询、聚类和分类等数据挖掘任务中展现出良好的效果。 论文通过对比标准数据和铝电解数据的实验结果,证实了新提出的加权夹角距离方法的有效性和可行性。尽管现有的其他方法如LP规范距离、动态时间弯曲距离和模式距离等在特定场景下表现出色,但加权夹角距离方法以其对时间序列复杂变形的适应性和精度提升,为时间序列分析提供了新的视角。 这篇论文对时间序列相似性度量领域的理论和技术进行了深入研究,并提出了一种更为精确和全面的度量方法,这对于提高时间序列分析的准确性和效率具有重要意义。