全局特征提取在时间序列聚类中的新相似性度量
![](https://csdnimg.cn/release/wenkucmsfe/public/img/starY.0159711c.png)
"本文提出了一种新的时间序列挖掘中的相似性度量方法,该方法用于全序列聚类,通过提取时间序列的统计分布特征、非线性特征和Fourier频谱转换等方面的11个全局特征,构建特征向量。这种方法在保留原始信息的同时,能够加速聚类计算,尤其在经济领域的应用中表现出良好的效果。文章通过实验对比,从主观和客观两方面评估了聚类结果的合理性。"
时间序列挖掘是一种数据分析技术,它涉及从时间上有序的数据中发现模式和趋势。在这个过程中,相似性度量是关键步骤,因为它决定了如何将相似的时间序列分组在一起。传统的相似性度量方法,如Euclidean距离或动态时间规整(DTW),可能无法充分考虑时间序列的复杂结构,例如非线性变化和周期性特征。
本文提出的“全局特征”相似性度量方法,主要关注三个方面:
1. **统计分布特征**:时间序列的统计特性,如均值、方差、峰度和偏度等,能够反映序列的基本趋势和波动情况。通过对这些统计量的分析,可以捕捉到序列的整体行为。
2. **非线性特征**:许多实际世界的时间序列数据是非线性的,传统线性方法可能无法有效处理。通过非线性分析,如混沌理论中的Lyapunov指数或者hurst指数,可以揭示序列的复杂动态行为。
3. **Fourier频谱转换**:Fourier变换将时间序列转化为频率域表示,帮助识别序列中的周期性成分。这种方法可以提取出时间序列的频率特性,对于识别周期性模式尤其有用。
通过这11个全局特征构建的特征向量,不仅可以保留原始时间序列的主要信息,还可以降低计算复杂度,从而加速聚类过程。实验结果证明,这种方法在全序列聚类中表现优秀,特别是在经济领域的时间序列数据上,可能因为经济数据通常包含复杂的非线性结构和周期性模式。
作者进行了两个数据集的实验,通过主观和客观的评估方式验证了聚类结果的合理性。主观评估可能包括专家评审或领域知识的应用,而客观评估可能基于预定义的评估指标,如轮廓系数或Calinski-Harabasz指数。
总结来说,这种新的全局特征相似性度量方法为时间序列挖掘提供了一种有效且高效的工具,尤其适用于处理非线性、有周期性特征的时间序列数据。它不仅简化了计算过程,还提升了聚类结果的准确性,对于数据分析和预测任务具有重要价值。
110 浏览量
2021-07-14 上传
1313 浏览量
2021-07-14 上传
278 浏览量
830 浏览量
145 浏览量
点击了解资源详情
点击了解资源详情
![](https://profile-avatar.csdnimg.cn/6ca1655e33714cf1bb639e0dbea4ad48_wxfei2006.jpg!1)
wxfei2006
- 粉丝: 3
最新资源
- PyDynamics:非线性动力系统模拟分析的Python工具
- echarts三级地图json数据及交互demo解析
- 解决VS2019安装时出现错误1316的问题
- C++系统编程:XLCoptimized压缩包解压及pop3处理程序
- Flutter训练营资源汇总:IRIS-Flutter-Bootcamp-2021完整版
- 实现蓝牙聊天仅需3个Java文件的Android官方示例
- 门限回归算法VB程序代码下载指南
- MATLAB三维体积图开发与绘制技术解析
- 图形学入门:简易光线追踪器实现教程
- LL(1)分析程序实现与文法改写
- 使用DSP源代码进行I2C测试程序的开发实践
- PLSQL Developer 12中实现光标智能定位技巧
- 鼠标悬停触发侧栏显示的导航设计
- HTML技术在解密游戏网页设计中的应用
- Windows进程查看器使用教程与父进程状态解析
- C#邮件发送实现方法及在Web与WinFrom开发中的应用