DNMC算法:动态邻近选择改进的Chameleon聚类

需积分: 10 1 下载量 172 浏览量 更新于2024-08-18 1 收藏 929KB PDF 举报
本文主要探讨了一种创新的聚类算法——基于动态近邻选择模型的Chameleon算法(DNMC),该算法是在2010年由赵学锋、杨海斌和王秀花在西北师范大学学报(自然科学版)上发表的研究成果。Chameleon算法原本是一种用于层次聚类的高效方法,但原有的M-Chameleon算法可能存在一定的局限性。DNMC算法的提出是对原有算法性能的改进,它在设计中引入了回溯机制,这种机制有助于处理数据合并后的分解过程,从而提高算法的效率和精度。 在理论分析的基础上,DNMC算法优化了邻近节点的选择策略,使得在处理大规模数据集时,特别是标准数据集如Wine和Iris上,其fa指标(一种衡量聚类质量的指标)表现优于M-Chameleon算法。这表明DNMC算法在保持良好聚类效果的同时,能够在处理复杂度较高的任务时展现出更高的效能。 此外,作者还通过对各个属性的差异度进行计算,发现了一些对聚类结果影响较小的属性。这些发现对于优化算法的时间复杂度至关重要,因为删除这些不重要的属性可以显著降低算法运行所需的时间。这一策略对于实际应用中的大数据处理具有重要意义,因为它允许在不影响聚类质量的前提下,减少计算资源的消耗。 总结来说,本文的贡献在于提出了一种更有效的Chameleon变体——DNMC,它在保持高聚类性能的同时,通过动态调整邻近选择和属性筛选,提高了算法的实用性和效率。这对于理解层次聚类算法的改进路径以及如何在实际问题中优化算法性能提供了有价值的研究成果。