演化聚类算法在动态数据中的应用与研究
版权申诉
39 浏览量
更新于2024-07-02
1
收藏 4.67MB PDF 举报
"本文主要探讨了演化聚类算法在处理动态数据中的应用,针对演化数据聚类过程中的时间平滑性和聚类质量平衡问题进行了深入研究。文章提出了三种不同的方法来解决这些问题,包括基于差分进化算法的deEC方法、多峰优化视角下的聚类策略以及数据级别的平滑性实现技术。这些方法旨在提高聚类结果的实时性和稳定性,以更好地反映数据随时间变化的分布特性。"
演化聚类算法是应对动态数据环境的一种有效工具,它能够适应数据分布随时间的变化。文章首先介绍了演化数据聚类的基本概念和挑战,强调了保持聚类结果在时间上的平滑性与准确反映数据分布的重要性。
第一部分,作者提出了一种名为deEC(基于差分进化演化聚类)的方法。deEC利用差分进化算法的全局搜索能力,动态调整平滑性框架的参数,以在聚类质量和时间平滑性之间找到最佳平衡。聚类结果的平滑性被理解为个体在不同时间点的适应性,适应性越高,表明聚类方案更能反映数据的历史分布。
第二部分,研究从多峰优化的角度出发,采用多峰优化算法寻找全局和局部最优解。结合归一化互信息(NMI)指数选择策略,确保当前时刻的聚类结果既能反映数据的最新分布,又能保持与过去结果的平滑过渡。
第三部分,文章探索了在数据级别实现时间平滑性的两种技术。这些技术通过分析历史数据的模式来构建当前数据矩阵,然后利用层次聚类算法生成聚类结果,从而在数据层面保证了聚类的连续性。
整个研究通过合成数据和真实数据的实验,验证了所提方法的有效性,并对比了它们的性能。这些方法对于理解和解决演化数据聚类问题提供了新的视角,对于机器学习和数据挖掘领域的研究具有重要的理论和实践价值。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2019-07-22 上传
2022-07-04 上传
2022-06-26 上传
2019-09-12 上传
2019-09-11 上传
2019-07-22 上传
programyg
- 粉丝: 173
- 资源: 21万+
最新资源
- Credit_Risk_Analysis:使用机器学习算法进行分析以使用LendingClub的数据集识别信用卡风险
- Audio:project project这个项目是使用https制作的
- 智能果蔬水培系统
- stock-analysis
- MySalesCarProject
- sheql:调度查询语言
- 【地产资料】XX地产店长管理核心大纲.zip
- P2P-draw:点对点绘图应用程序
- CEUB-PPW:计划网络的动产仓库
- Shopping-Application-Java-:具有文本文件数据库的购物应用程序
- CS441_Proj6:自己设计的游戏
- Excel模板外币贷款明细表.zip
- npm-why:标识为什么安装了软件包。 等同于npm软件包的“ yarn why”
- R-code
- PTT-18Plus:主流浏览器附加元件,用来略过PTT 的「电脑网路内容分级处理办法」确认画面
- 一个基于hadoop的大数据实战.zip