改进的半监督自适应亲和传播聚类算法

需积分: 11 2 下载量 112 浏览量 更新于2024-09-10 1 收藏 559KB PDF 举报
"一种结合半监督的改进自适应亲和传播聚类.pdf" 本文主要探讨了在现有的自适应亲和传播聚类方法中存在的问题,即聚类时间过长和精度不高的缺点。为解决这些问题,作者提出了一个创新性的算法——结合半监督学习的改进自适应亲和传播聚类(SAAP)。该算法融合了半监督聚类的思想,以提高聚类效率和准确性。 在SAAP算法中,首先应用半监督学习方法来更新样本间的相似度矩阵。半监督学习允许利用少量标记数据来指导未标记数据的聚类过程,从而增强聚类效果。接着,算法基于亲和传播聚类基础,采用二分查找策略来自适应地搜索最合适的聚类数量。这种方法可以更高效地遍历可能的聚类空间,避免无效的计算。最后,通过一个加权评价函数来确定最优的聚类结果,这个评价函数考虑了聚类的内部紧凑性和外部分离性,以保证聚类的稳定性和有效性。 实验证明,SAAP算法相比传统的自适应亲和传播聚类,具有更快的运行速度,同时在错分率和聚类有效性方面表现出显著提升。这种改进对于大规模数据集尤其有益,因为它能在保证聚类质量的同时,减少计算时间和资源消耗。 本文的作者来自陕西师范大学计算机科学学院,他们在模式识别、图像处理和智能信息处理等领域有深入研究。通过这篇论文,他们不仅贡献了一种新的聚类方法,也为半监督学习在聚类问题中的应用提供了新的视角和实践案例。 关键词:亲和传播,半监督聚类,自适应聚类,成对约束 中图分类号:TP18 文献标志码:A 文章编号:1001-3695(2010)12-4436-03 doi:10.3969/j.issn.1001-3695.2010.12.010 通过这种方式,SAAP算法提供了一种更为优化的聚类解决方案,特别适用于那些需要在有限计算资源下完成高效聚类任务的场景。这种改进对于数据挖掘、机器学习以及模式识别等领域的研究具有重要的理论价值和实际应用前景。