稀疏表示提升近邻传播聚类算法

需积分: 8 0 下载量 119 浏览量 更新于2024-08-08 收藏 329KB PDF 举报
"基于稀疏表示的近邻传播聚类算法 (2014年) - 西南大学学报(自然科学版)" 本文主要探讨了一种创新的聚类算法——基于稀疏表示的近邻传播聚类算法。聚类是数据分析中的重要技术,广泛应用于模式识别、数据挖掘、机器学习等多个领域。传统的聚类算法如层次聚类、K-means等,通常依赖于特定的距离度量,如欧氏距离。然而,近邻传播聚类算法(AP算法)突破了这些限制,它不强制要求距离矩阵对称或距离为正,因此适用范围更广。 AP算法的核心是通过传播过程来确定样本间的相似关系,进而进行聚类。在原始的AP算法中,采用的是欧式距离。然而,当处理高维数据时,欧氏距离可能无法有效地捕捉数据的内在结构,导致聚类效果不佳。为解决这一问题,研究者们提出了改进方案,如基于鲁棒路径相似度的近邻传播聚类算法。 本文则进一步引入稀疏表示理论。稀疏表示能够很好地刻画样本间的相似度,尤其是对于包含噪声的数据,其鲁棒性和判别性优势明显。作者将样本通过稀疏表示得到的重构系数作为新的相似性度量,用以指导近邻传播的过程。这种方法有望改善聚类性能,降低噪声影响,并增强对复杂数据结构的识别能力。 实验结果表明,基于稀疏表示的近邻传播聚类算法在多个数据集上表现出优于基于其他距离度量的AP算法的聚类效果。这意味着,结合稀疏表示的聚类方法在处理高维、复杂或噪声较大的数据时,具有更强的适应性和准确性。 这项工作为聚类算法提供了新的思路,即利用稀疏表示来提升聚类的效率和效果。这对于未来在大数据分析、图像处理等领域应用聚类算法具有重要的实践意义,也为后续研究提供了理论基础和参考。通过优化距离度量方式,我们可以期待在聚类任务中取得更精确和有意义的结果。