优化相异性度量的Affinity Propagation聚类算法研究

需积分: 10 0 下载量 10 浏览量 更新于2024-09-07 收藏 126KB PDF 举报
"这篇论文研究了一种针对Affinity Propagation聚类算法的改进方法,即优化相异性度量的Affinity Propagation算法。作者陈新泉来自上饶师范学院数学与计算机系,他提出该算法旨在更好地处理混合属性数据点集,以获得更精确的聚类结果。论文对算法进行了时间复杂度和收敛性的分析,并通过实验对比展示了其在某些情况下能提升聚类精度。关键词包括相异性度量、Affinity Propagation、有序属性、无序属性和混合属性。" Affinity Propagation(亲和传播)是一种无中心的聚类算法,由Frey和Dueck在2007年提出。它依赖于两个关键概念:相似性和责任。相似性度量了两个样本之间的相似程度,而责任则反映了一个样本成为另一个样本的聚类中心的可能性。原版算法中,相似性是预先设定的,可能不适应所有类型的数据集。 陈新泉的研究则关注如何优化这个度量,特别是对于混合属性数据集。混合属性数据包含有序和无序属性,处理这样的数据集需要更复杂的度量方式。论文中提出的新算法通过优化相异性度量,使得算法能够更好地捕捉数据点集的空间结构,从而发现更有意义的聚类分布。 算法的优化部分可能涉及动态调整特征权重,使得每个特征的重要性可以根据其在聚类过程中的贡献而变化。这有助于找到更适合特定数据集的特征子集或特征权重向量,从而提高聚类的准确性和稳定性。论文中提到的其他研究,如Frigui、Elaine Y. Chan、武宇文和Joshua Zhexue Huang的工作,也表明了特征权重优化在聚类和分类任务中的重要性。 论文通过实验对比了新算法与传统Affinity Propagation以及其它聚类算法(如k-means和FCM)在German数据集上的表现。实验结果证实,优化后的算法有时能够提供更高的聚类精度,证明了其有效性和潜在优势。同时,论文还对未来的研究方向提出了展望,为进一步探索和改进这一领域指明了道路。 这篇论文是对Affinity Propagation聚类算法的重要扩展,特别是在处理混合属性数据时的相异性度量优化,这对于数据挖掘和机器学习领域具有实践意义,尤其是在那些依赖于精确聚类结果的应用中。