最小张树驱动的属性聚类算法:优势与应用

需积分: 14 1 下载量 57 浏览量 更新于2024-09-06 1 收藏 256KB PDF 举报
该篇论文深入探讨了"一种基于最小张树的属性聚类算法",由彭春华和程乾生两位作者于2001年2月发表在《系统工程理论与实践》的第2期,文章编号为100026788(2001)0220030205。论文的核心思想是将图论中的最小张树方法与属性聚类相结合,提出了一种新颖的算法。最小张树是一种在图中寻找具有最短总边长的树形结构,而在这里被用来定义样本间的相似性和接触度,这两种概念成为了构建新算法的基础。 作者首先介绍了无监督聚类分析的重要性,它在模式识别领域中扮演着关键角色,尤其是在没有先验知识的情况下,通过相似度准则对样本进行自动分类。他们提出的算法试图克服传统方法如FCM(Fuzzy C-Means)和AKM(Another K-Means)的局限性,比如可能存在的过度拟合或者局部最优问题。 论文的核心部分详细阐述了新算法如何利用最小张树来量化样本间的联系,并通过对比实验展示了这种新方法在处理特定问题时的优越性能。相比于其他聚类算法,它不仅提高了聚类的准确性,还能在一定程度上更好地适应实际问题,从而避免了传统方法可能出现的偏差或不稳定性。 关键词部分明确了研究的核心概念,包括最小张树(minimum spanning tree)、属性聚类、相似度和接触度,这些概念的融合是本文创新的关键所在。中图分类号O213α表明这篇论文属于计算机科学和技术领域,特别是数据挖掘和机器学习的研究方向。 这篇论文通过理论与实践相结合的方式,为属性聚类问题提供了一个新颖且有效的解决方案,具有较高的实用价值和理论贡献。通过阅读这篇论文,读者可以了解到如何利用最小张树的思想改进聚类算法,提高其在实际应用中的效果。