鲁棒模糊聚类新算法:基于交叉熵优化

需积分: 9 0 下载量 164 浏览量 更新于2024-08-13 1 收藏 1.17MB PDF 举报
"鲁棒的交叉熵模糊聚类算法是一种改进的模糊C-均值聚类(FCM)算法,旨在解决FCM算法对噪声敏感和易陷入局部最优的问题。该算法通过引入交叉熵概念来重新定义目标函数,用以度量样本隶属度的差异,并利用拉格朗日乘子法和朗伯W函数优化目标函数。同时,通过对样本划分矩阵的分布分析,实现了对噪声样本的有效识别,从而提高了算法的鲁棒性和噪声样本识别的准确性。在人工数据和加噪标准数据集上的实验验证了该算法的优势。" 本文是姚兰、严寒冰和蔚泽峰三位作者的研究成果,他们分别在智能信息处理和模式识别领域有着深入研究。研究中提到的鲁棒交叉熵模糊聚类算法是针对模糊C-均值聚类算法的不足而提出的。传统的FCM算法在处理含有噪声的数据时,常常会受到干扰,导致聚类效果不佳,容易收敛到非全局最优解。为了解决这些问题,该算法创新性地引入了交叉熵作为衡量样本隶属度差异的指标。 交叉熵作为一种信息理论中的度量,能够有效地量化不同概率分布之间的差异。在此算法中,它被用来重新定义FCM的目标函数,使得算法在优化过程中更加关注样本间的差异性,从而降低噪声对聚类结果的影响。为了优化这个新的目标函数,作者采用了拉格朗日乘子法,这是一种在约束条件下求解优化问题的常见数学工具。同时,朗伯W函数也被应用,它在数值计算中常用于解决非线性方程组,帮助算法找到全局最优解。 在处理噪声样本识别方面,研究者分析了样本划分矩阵的分布特性,这有助于区分正常样本和噪声样本。通过对这些特性的理解和利用,算法能够更准确地识别并处理噪声,进一步增强了算法的鲁棒性。 实验部分,研究者在人工数据集和加噪的标准数据集上进行了测试,结果显示,鲁棒的交叉熵模糊聚类算法相比传统的FCM算法,其抗干扰能力和噪声样本识别的准确率有显著提升。这一改进对于实际应用中遇到噪声数据的情况具有重要意义,可以提升聚类效果,尤其适用于需要高精度和稳定性的数据分析任务。 这项研究为模糊聚类领域提供了一个新的、更为鲁棒的解决方案,对于噪声数据的处理和聚类性能的提高具有积极的推动作用。其应用潜力在于能更好地处理实际复杂环境下的数据,如图像处理、模式识别等领域的应用。