HMM双加权集成:提升时间数据聚类性能

1 下载量 36 浏览量 更新于2024-08-26 收藏 3.01MB PDF 举报
"通过基于HMM的方法进行时间数据聚类的双加权集成" 这篇研究论文探讨了如何利用隐马尔科夫模型(HMM, Hidden Markov Model)为基础的方法来改进时间序列数据聚类的性能。作者是Yun Yang和Jianmin Jiang,分别来自云南大学的国家软件示范学院和深圳大学计算机科学与软件工程学院的研究未来媒体计算研究所。文章在Pattern Recognition期刊上发表,该期刊可在ScienceDirect平台上找到。 在时间序列数据聚类中,HMM通常被用作捕捉数据内在的时间依赖性和动态模式的有效工具。然而,HMM的初始化问题和模型选择问题一直是挑战,这些问题可能导致聚类结果的不稳定性。为了解决这些问题,论文提出了一种新颖的双加权集成方法。 双加权集成的核心在于,在评估每个分割和优化共识函数的过程中采用双权重策略。这种策略旨在更好地处理不同HMM模型的贡献,以提高聚类的准确性和鲁棒性。在数据聚类中,初始化问题可能导致不同的起始状态导致不同的聚类结果,而模型选择问题则涉及到如何在众多可能的HMM结构中选取最合适的模型。 论文的结构可能包括以下几个部分:介绍、相关工作、方法论(包括HMM的基础知识,双加权集成的具体实现)、实验设计(数据集选择、评估指标)、实验结果与分析、讨论以及结论。实验部分可能对比了提出的双加权集成方法与其他单一HMM聚类或传统聚类算法的性能,以证明其优越性。 关键词包括数据聚类、集成学习、隐马尔科夫模型和模型选择,这表明论文的重点在于如何通过集成学习策略来优化HMM在聚类任务中的应用,并解决与之相关的初始化和模型选择问题。 论文的接收日期是2016年11月22日,经过修订后于2017年10月18日接受,并于2017年11月18日在线发布。这反映了科研界的快速进步和持续的研究活动。 这篇论文对理解如何利用HMM进行时间序列数据聚类提供了新的见解,并提出了一种创新的集成学习策略,旨在提升聚类的稳定性和准确性。对于从事时间序列分析、数据挖掘、机器学习和模式识别领域的研究人员来说,这是一个有价值的研究贡献。