优化相异性度量的Affinity Propagation聚类算法研究

下载需积分: 10 | PDF格式 | 126KB | 更新于2024-09-07 | 62 浏览量 | 举报

"这篇论文研究了一种针对Affinity Propagation聚类算法的改进方法，即优化相异性度量的Affinity Propagation算法。作者陈新泉来自上饶师范学院数学与计算机系，他提出该算法旨在更好地处理混合属性数据点集，以获得更精确的聚类结果。论文对算法进行了时间复杂度和收敛性的分析，并通过实验对比展示了其在某些情况下能提升聚类精度。关键词包括相异性度量、Affinity Propagation、有序属性、无序属性和混合属性。" Affinity Propagation（亲和传播）是一种无中心的聚类算法，由Frey和Dueck在2007年提出。它依赖于两个关键概念：相似性和责任。相似性度量了两个样本之间的相似程度，而责任则反映了一个样本成为另一个样本的聚类中心的可能性。原版算法中，相似性是预先设定的，可能不适应所有类型的数据集。陈新泉的研究则关注如何优化这个度量，特别是对于混合属性数据集。混合属性数据包含有序和无序属性，处理这样的数据集需要更复杂的度量方式。论文中提出的新算法通过优化相异性度量，使得算法能够更好地捕捉数据点集的空间结构，从而发现更有意义的聚类分布。算法的优化部分可能涉及动态调整特征权重，使得每个特征的重要性可以根据其在聚类过程中的贡献而变化。这有助于找到更适合特定数据集的特征子集或特征权重向量，从而提高聚类的准确性和稳定性。论文中提到的其他研究，如Frigui、Elaine Y. Chan、武宇文和Joshua Zhexue Huang的工作，也表明了特征权重优化在聚类和分类任务中的重要性。论文通过实验对比了新算法与传统Affinity Propagation以及其它聚类算法（如k-means和FCM）在German数据集上的表现。实验结果证实，优化后的算法有时能够提供更高的聚类精度，证明了其有效性和潜在优势。同时，论文还对未来的研究方向提出了展望，为进一步探索和改进这一领域指明了道路。这篇论文是对Affinity Propagation聚类算法的重要扩展，特别是在处理混合属性数据时的相异性度量优化，这对于数据挖掘和机器学习领域具有实践意义，尤其是在那些依赖于精确聚类结果的应用中。