多目标进化算法在多距离聚类研究中的应用

需积分: 9 1 下载量 108 浏览量 更新于2024-09-08 收藏 1.22MB PDF 举报
"这篇论文研究了基于多目标进化算法的多距离聚类方法,通过结合欧氏距离和Path距离来创建聚类框架MOMDC,旨在解决传统聚类算法依赖单一距离度量的问题。该框架首先对数据集进行预聚类,然后合并结果并计算子类间多种距离关系,最后利用多目标进化算法在两种距离空间中进行并行聚类。论文还介绍了实数-标签编码的染色体设计和基于两种距离的适应度函数。实验比较显示,MOMDC在各种数据集上表现优秀。" 本文深入探讨了多距离聚类这一领域,指出传统聚类算法的局限性在于它们通常基于单一的距离度量进行操作。为了克服这一限制,研究者提出了一种名为MOMDC(Multiobjective Evolutionary Multiple Distance Measure Clustering)的新框架,该框架巧妙地整合了多种距离度量,特别是欧氏距离和Path距离。欧氏距离是衡量两点之间直线距离的标准方法,而Path距离则考虑了数据点之间的路径信息,它们在不同场景下各有优势。 MOMDC的工作流程包括预聚类、结果合并和并行聚类三个步骤。首先,数据集被分别用两种距离度量进行预聚类,生成初步的聚类结果。接下来,这些结果被合并,以减少问题的复杂性,并计算子类别间的两种距离关系。最后,多目标进化算法被应用到这两种距离空间中,进行并行聚类优化。在多目标进化算法的设计中,采用实数-标签编码的染色体表示法,这是一种创新的编码策略,能够更好地适应多目标优化。同时,为了评价染色体的优劣,研究者设计了两个适应度函数,它们基于欧氏距离和Path距离,确保了算法在两种距离度量下的性能。 实验部分,MOMDC与其他经典聚类算法进行了对比,验证了其在处理各种数据集时的优越性能。这些结果证实了多距离度量聚类的有效性和实用性,特别是在应对复杂数据分布时。论文的作者们,包括刘丛、万秀华、彭敦陆和邬春学,他们的研究工作得到了多项基金项目的资助,涉及计算智能、机器学习、大数据处理和无线传感网络控制等领域。 这篇论文为聚类算法的研究提供了一个新的视角,即利用多目标进化算法处理多种距离度量,以提高聚类的质量和鲁棒性。这种方法对于大数据分析和机器学习领域具有重要的理论价值和实践意义。