图正则化非负模糊聚类算法研究

66 浏览量更新于2024-06-17 收藏 1.05MB PDF 举报

"基于图正则化的非负模糊联合编码数据聚类" 在机器学习和数据挖掘领域，非负矩阵分解（Non-negative Matrix Factorization, NMF）是一种常用的数据表示和特征提取方法。NMF能够将数据分解为两个非负矩阵，通常被用于模式识别、图像分析、文本挖掘等多种任务，因为它能提取出数据的积极组成部分，增强数据的可解释性。在聚类任务中，NMF可以帮助我们理解数据的内在结构。传统的NMF聚类流程通常包括两个步骤：首先通过NMF学习数据的非负系数矩阵，然后使用这些系数执行K-均值聚类来确定样本的最终类别。然而，这种分离的过程可能会丢失一些重要信息，因为K-均值聚类是对系数矩阵的独立操作，没有考虑系数之间的关系。针对这个问题，文章提出了一个新颖的聚类模型——基于图正则化的非负模糊联合编码与聚类（Graph-regularized Joint Non-negative and Fuzzy Coding, G-JNFC）。该模型创新地将模糊聚类与NMF结合，并引入图正则化项，以捕获数据间的拓扑结构和相似性。在G-JNFC中，字典矩阵的每一列都被视为一个潜在的聚类中心，同时考虑到数据点对这些中心的模糊隶属度，这使得聚类结果更加灵活和准确。图正则化是一种约束优化方法，它利用数据点之间的连接信息来平滑模型参数，有助于发现更稳定的聚类结构。在G-JNFC中，图正则化用于促进系数矩阵的结构一致性，使得相似的数据点在聚类时更可能被分到同一组。文章通过交替方向优化框架解决了G-JNFC模型的优化问题，即在每次迭代中分别更新字典矩阵和系数矩阵，同时保持非负约束。作者对模型的收敛性和计算复杂性进行了分析，并在合成数据集和典型基准数据集上进行了广泛实验，实验结果证实了G-JNFC在数据聚类任务上的有效性。总结起来，"基于图正则化的非负模糊联合编码数据聚类"是一种创新的聚类方法，它整合了NMF、模糊聚类和图正则化的优势，提高了聚类的性能和鲁棒性。这种方法对于那些需要考虑数据间复杂关联和不确定性的情景尤其适用，比如社交网络分析、生物信息学等领域。

展开