多尺度分段线性表示提升时间序列全局特征精度

需积分: 9 2 下载量 94 浏览量 更新于2024-09-06 1 收藏 611KB PDF 举报
本文研究的焦点在于"基于多尺度的时间序列固定分段数线性表示"这一创新方法,针对传统时间序列线性表示存在的问题进行了改进。当前的线性表示方法往往依赖于启发式策略来提取局部特征点作为分段点,这种做法可能导致局部最优解,无法充分展现时间序列的全局特征。此外,它们通常采用单一的拟合误差阈值来确定分段数量,这种方法在实际应用中并不精确,影响了后续时间序列分析的精度。 PLR_BTBU方法的提出旨在克服这些问题。首先,作者借鉴二叉树层次遍历的思想,通过对时间序列进行全局特征提取,将原始序列划分为若干初始段。这样做的目的是捕捉序列的整体趋势,而非仅仅依赖局部细节。接着,通过分析斜率变化特征,对整个序列进行符号化处理,以便更好地理解和量化不同段落的特征变化。 在确定分段点分布时,PLR_BTBU关注初始分段内的符号特征,这有助于更加精准地划分序列,并避免了过度分割或过度聚合的问题。进一步,该方法采用了一种改进的固定分段数的自底向上融合算法,逐步将子序列整合到预定的分段数目,确保了最终表示的合理性。 实验结果显示,PLR_BTBU方法相较于现有方法有显著优势。它能更好地保留时间序列的全局结构,使得拟合后的序列与原始序列之间的拟合误差减小,从而提高了数据挖掘的效率和准确性。这对于处理大规模时间序列数据,尤其是在存在噪声和高维性的情况下,具有重要的实际应用价值。 这篇论文提供了一种新颖且高效的线性表示方法,对于时间序列挖掘领域的研究者来说,其在保留序列特性的同时,降低了预处理复杂度,对于提升时间序列数据分析的性能具有重要意义。