自适应谱聚类算法:自动参数选择的新方法

需积分: 20 0 下载量 30 浏览量 更新于2024-08-13 收藏 367KB PDF 举报
"自适应谱聚类算法研究 (2009年) - 南京航空航天大学计算机科学与工程系的研究论文" 谱聚类是一种非监督学习方法,它在数据挖掘和机器学习领域中用于对数据进行无先验知识的分组。这种算法利用数据的相似度矩阵构建一个谱图,然后通过对谱图进行特征分解来识别潜在的聚类结构。相比于传统的基于距离或密度的聚类算法,谱聚类在处理非线性可分数据时表现出色,能够发现复杂的数据分布模式。 然而,谱聚类的效果很大程度上取决于一个关键参数——尺度参数(scaling parameter)。这个参数的选择直接影响到数据的相似度计算,进而影响聚类结果的质量。传统的谱聚类算法通常需要用户手动设定这个参数,而设定不当可能导致聚类性能下降。 本文提出的自适应谱聚类算法(Adaptive Spectral Clustering, ASC)旨在解决这个问题。通过引入类似于核函数选择的技术,该算法可以自动选择最合适的尺度参数。这种方法借鉴了核方法的思想,能够在高维空间中更好地捕捉数据的内在结构,从而实现对尺度参数的有效估计。 在实验部分,研究人员对比了自适应谱聚类算法与其他已有的谱聚类参数选择算法。实验在人造数据集和UCI(University of California, Irvine)公开数据集上进行,结果显示,自适应谱聚类算法在许多情况下表现优于其他参数选择策略,证明了其在实际应用中的优越性。 关键词:自适应谱聚类、参数选择、非线性可分、核函数、聚类算法 这篇论文对谱聚类算法进行了深入研究,提出了一种新的自适应方法,对于解决谱聚类中的关键参数选择问题提供了有效解决方案,对于后续的谱聚类算法优化和实际应用具有重要的参考价值。