时间序列特征提取与聚类算法优化研究

5星 · 超过95%的资源 需积分: 13 2 下载量 73 浏览量 更新于2024-07-03 收藏 10.46MB DOC 举报
"本文主要探讨了时间序列特征提取与聚类算法的研究,由中山大学的李伟在导师张磊指导下完成,属于应用数学领域的硕士论文。文章着重关注时间序列的模式表示、相似性查询、聚类和分类、异常检测等关键问题。" 在时间序列数据挖掘中,特征提取和聚类算法扮演着重要角色。传统的聚类算法如层次聚类和K-means等在处理时间序列时可能会受到局限,因为它们通常依赖于欧氏距离,对于时间序列这种具有时间依赖性的数据可能不适用。因此,论文作者提出了一种新的分段混合特征提取方法,旨在克服现有方法无法同时描述时间序列整体趋势和局部特征的挑战。 该方法首先基于分段线性模型提取时间序列的局部特征,然后结合时间序列的总体趋势,形成一种综合的特征表示。通过引入聚类准则函数,论文对不同的聚类算法进行了分析和比较,使聚类效果的评估更为直观。作者进一步将提出的分段混合特征提取算法应用于层次聚类,实验结果表明这种方法能够改善时间序列的层次聚类效果,提高识别效率,验证了新算法的有效性。 论文的贡献在于提供了一个更适应时间序列数据特性的特征提取框架,并且改进了聚类算法在处理时间序列数据时的性能。未来的研究方向可能包括对其他类型的时间序列数据进行更深入的分析,优化特征提取算法以适应更多变的场景,以及探索更高效的聚类策略。 关键词:时间序列距离度量,时间序列聚类,特征提取,分段混合特征提取 前言部分指出,时间序列分析是数据挖掘的重要组成部分,而有效的特征提取和聚类算法对于理解和挖掘时间序列数据的潜在结构至关重要。论文通过分析常用的距离度量和聚类算法,创新性地提出新的特征提取方法,旨在提升聚类质量和效率,为时间序列数据的处理提供了新的思路。