鲁棒模糊聚类新算法：基于交叉熵优化

需积分: 9 164 浏览量更新于2024-08-13 1 收藏 1.17MB PDF 举报

"鲁棒的交叉熵模糊聚类算法是一种改进的模糊C-均值聚类（FCM）算法，旨在解决FCM算法对噪声敏感和易陷入局部最优的问题。该算法通过引入交叉熵概念来重新定义目标函数，用以度量样本隶属度的差异，并利用拉格朗日乘子法和朗伯W函数优化目标函数。同时，通过对样本划分矩阵的分布分析，实现了对噪声样本的有效识别，从而提高了算法的鲁棒性和噪声样本识别的准确性。在人工数据和加噪标准数据集上的实验验证了该算法的优势。" 本文是姚兰、严寒冰和蔚泽峰三位作者的研究成果，他们分别在智能信息处理和模式识别领域有着深入研究。研究中提到的鲁棒交叉熵模糊聚类算法是针对模糊C-均值聚类算法的不足而提出的。传统的FCM算法在处理含有噪声的数据时，常常会受到干扰，导致聚类效果不佳，容易收敛到非全局最优解。为了解决这些问题，该算法创新性地引入了交叉熵作为衡量样本隶属度差异的指标。交叉熵作为一种信息理论中的度量，能够有效地量化不同概率分布之间的差异。在此算法中，它被用来重新定义FCM的目标函数，使得算法在优化过程中更加关注样本间的差异性，从而降低噪声对聚类结果的影响。为了优化这个新的目标函数，作者采用了拉格朗日乘子法，这是一种在约束条件下求解优化问题的常见数学工具。同时，朗伯W函数也被应用，它在数值计算中常用于解决非线性方程组，帮助算法找到全局最优解。在处理噪声样本识别方面，研究者分析了样本划分矩阵的分布特性，这有助于区分正常样本和噪声样本。通过对这些特性的理解和利用，算法能够更准确地识别并处理噪声，进一步增强了算法的鲁棒性。实验部分，研究者在人工数据集和加噪的标准数据集上进行了测试，结果显示，鲁棒的交叉熵模糊聚类算法相比传统的FCM算法，其抗干扰能力和噪声样本识别的准确率有显著提升。这一改进对于实际应用中遇到噪声数据的情况具有重要意义，可以提升聚类效果，尤其适用于需要高精度和稳定性的数据分析任务。这项研究为模糊聚类领域提供了一个新的、更为鲁棒的解决方案，对于噪声数据的处理和聚类性能的提高具有积极的推动作用。其应用潜力在于能更好地处理实际复杂环境下的数据，如图像处理、模式识别等领域的应用。

收稿日期：２０１８０３２１；修回日期：２０１８０５０７　　基金项目：四川省教育厅重点资助项目（１７ＺＡ００７３）；成都信息工程大学引进人才资助项

目（ＫＹＴＺ２０１５２２）

作者简介：姚兰（１９８０），女，副教授，博士，主要研究方向为智能信息处理、模式识别与图像处理（ｄａｎｃｙｙａｏ＠ｃｕｉｔ．ｅｄｕ．ｃｎ）；严寒冰（１９７７），男，

副教授，博士，主要研究方向为智能信息处理；蔚泽峰（１９７６），男，副教授，硕士，主要研究方向为智能信息处理．

鲁棒的交叉熵模糊聚类算法



姚　兰，严寒冰，蔚泽峰

（成都信息工程大学控制工程学院，成都６１０２２５）

摘　要：针对模糊Ｃ均值聚类（ＦＣＭ）算法对噪声敏感、容易收敛到局部极小值的问题，提出一种基于交叉熵的

模糊聚类算法。通过引入交叉熵重新定义了传统ＦＣＭ算法的目标函数，利用交叉熵度量样本隶属度之间的差

异性，并采用拉格朗日求解方法和朗伯Ｗ函数解决了目标函数的优化问题，此外，分析了样本划分矩阵的分布

情况，依据分布特性对噪声样本进行识别。人工数据集合和标准数据集加噪的实验结果表明，该算法提高了传

统ＦＣＭ算法的抗干扰能力，具有更强的鲁棒性，噪声样本识别的准确率较高。

关键词：模糊聚类；交叉熵；模糊Ｃ均值聚类；聚类性能

中图分类号：ＴＰ３０１．６　　　文献标志码：Ａ　　　文章编号：１００１３６９５（２０１９）１００１４２９４８０４

ｄｏｉ：１０．１９７３４／ｊ．ｉｓｓｎ．１００１３６９５．２０１８．０３．０１９８

Ｒｏｂｕｓｔｆｕｚｚｙｃｌｕｓｔｅｒｉｎｇａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｃｒｏｓｓｅｎｔｒｏｐｙ

ＹａｏＬａｎ，ＹａｎＨａｎｂｉｎｇ，ＷｅｉＺｅｆｅｎｇ

（ＳｃｈｏｏｌｏｆＣｏｎｔｒｏｌＥｎｇｉｎｅｅｒｉｎｇ，ＵｎｉｖｅｒｓｉｔｙｏｆＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，Ｃｈｅｎｇｄｕ６１０２２５，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：ＦｏｒｔｈｅｐｒｏｂｌｅｍｔｈａｔｔｈｅｔｒａｄｉｔｉｏｎａｌｆｕｚｚｙＣｍｅａｎｓｃｌｕｓｔｅｒｉｎｇ（ＦＣＭ）ａｌｇｏｒｉｔｈｍｉｓｅａｓｙｔｏｂｅａｆｆｅｃｔｅｄｂｙｎｏｉｓｅｄａｔａ，

ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄａｆｕｚｚｙｃｌｕｓｔｅｒｉｎｇａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｔｈｅｃｒｏｓｓｅｎｔｒｏｐｙ．Ｔｈｉｓａｌｇｏｒｉｔｈｍｉｎｔｒｏｄｕｃｅｄｔｈｅｃｒｏｓｓｅｎｔｒｏｐｙｔｏｔｈｅ

ｏｂｊｅｃｔｉｖｅｆｕｎｃｔｉｏｎｏｆＦＣＭａｌｇｏｒｉｔｈｍｔｏｍｅａｓｕｒｅｔｈｅｄｉｆｆｅｒｅｎｃｅｂｅｔｗｅｅｎｍｅｍｂｅｒｓｈｉｐｆｕｎｃｔｉｏｎｏｆｄａｔａ，ａｎｄｕｓｅｄＬａｇｒａｎｇｅｍｅｔｈｏｄ

ａｎｄＬａｍｂｅｒｔＷｆｕｎｃｔｉｏｎｔｏｓｏｌｖｅｔｈｅｏｐｔｉｍｉｚａｔｉｏｎｐｒｏｂｌｅｍｏｆｔｈｅｏｂｊｅｃｔｉｖｅｆｕｎｃｔｉｏｎ．Ｔｈｉｓａｌｇｏｒｉｔｈｍｃｏｕｌｄｉｄｅｎｔｉｆｙｔｈｅｎｏｉｓｅｓａｍ

ｐｌｅｓａｃｃｏｒｄｉｎｇｔｏｔｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｔｈｅｓａｍｐｌｅｐａｒｔｉｔｉｏｎｍａｔｒｉｘ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔｒｅｓｕｌｔｓｏｎａｓｙｎｔｈｅｔｉｃｄａｔａｓｅｔａｎｄａｓｔａｎｄａｒｄ

ｄａｔａｓｅｔｗｉｔｈｎｏｉｓｙｓｈｏｗｔｈａｔｔｈｅｐｒｏｐｏｓｅｄａｌｇｏｒｉｔｈｍｉｓｍｏｒｅｒｏｂｕｓｔａｎｄｈａｓｂｅｔｔｅｒｃｌｕｓｔｅｒｉｎｇｒｅｓｕｌｔｓ．

Ｋｅｙｗｏｒｄｓ：ｆｕｚｚｙｃｌｕｓｔｅｒｉｎｇ；ｃｒｏｓｓｅｎｔｒｏｐｙ；ＦＣＭ；ｃｌｕｓｔｅｒｉｎｇｐｅｒｆｏｒｍａｎｃｅ

　　自１９６９年Ｒｕｓｐｉｎｉ

［１］

首先将模糊理论引入聚类分析，基于

模糊理论的聚类分析方法就受到了研究人员的广泛关注，提出

了多种模糊聚类分析方法。其中，模糊Ｃ均值聚类算法

［２］

因

其具有设计简单、解决问题范围广且易于实现的特点，已成为

模糊聚类算法中一种经典方法且在诸多领域得到了广泛应用。

但理论研究与实验表明，ＦＣＭ算法存在一些固有缺陷，如对噪

声数据极其敏感、容易收敛到局部极小点等。为此，研究人员

通过修改聚类算法的目标函数和弱化隶属度的约束条件提出

了很多算法，代表性算法主要有可能性聚类算法（ｐｏｓｓｉｂｉｌｉｓｔｉｃ

Ｃｍｅａｎｓ，ＰＣＭ）

［３］

及改进的ＩＰＣＭ算法

［４］

、可能性ＦＣＭ算法

（

ｐｏｓｓｉｂｉｌｉｓｔｉｃｆｕｚｚｙＣｍｅａｎｓ，ＰＦＣＭ）

［５，６］

、引入样本加权策略的

ＷＦＣＭ（ｗｅｉｇｈｔｅｄｆｕｚｚｙＣｍｅａｎｓ）算法

［７］

及相关算法

［８，９］

、基于

噪声模型的聚类算法

［１０］

及增强模糊划分的聚类算法

［１１，１２］

。

这些算法在一定程度上改进了ＦＣＭ所面临的问题，使其在实

际应用中有更强的适用能力。

受信息论中采用熵度量系统信息量大小的思想启发，将熵

引入ＦＣＭ算法展开了基于熵的模糊聚类算法研究。这类方法

使得样本点隶属度求解公式具有了高斯分布特性，从而表现出

更强的抗噪性。文献［

１３］采用熵函数作为目标函数的一个组

成部分，提出了极大熵聚类算法ＭＥＣ，但该方法对例外点较敏

感，例外点的干扰常使得到的聚类中心严重偏离。文献［１４］

提出了鲁棒的极大熵聚类算法（ｒｏｂｕｓｔｍａｘｉｍｕｍｅｎｔｒｏｐｙｃｌｕｓｔｅ

ｒｉｎｇ，ＲＭＥＣ），提高了算法对例外点的抗干扰能力。在引入模

糊熵的基础上，文献［１５］通过结合犹豫度重新定义目标函数

提出了直觉模糊Ｃ均值聚类算法，该算法对噪声数据抑制具

有一定的效果，但效果不明显，算法复杂性很高。文献［

１６］采

用相对熵替代熵提出了相对熵模糊

Ｃ均值聚类算法（ｒｅｌａｔｉｖｅ

ｅｎｔｒｏｐｙｆｕｚｚｙＣｍｅａｎｓｃｌｕｓｔｅｒｉｎｇ，ＲＥＦＣＭ）。文献［１７］提出了基

于广义熵的模糊聚类算法，并利用增广拉格朗日法和Ｈｏｐｆｉｅｌｄ

神经网络求解。文献［１８］提出了基于广义熵的可能性模糊Ｃ

均值聚类算法，能够更加正确地获得含噪声数据的聚类中心。

考虑到熵只针对单个变量，不能有效度量两个随机分布的

差异性以及不满足对称性等缺陷，本文将交叉熵引入传统

ＦＣＭ算法的目标函数，提出一种交叉熵模糊聚类算法（ｃｒｏｓｓ

ｅｎｔｒｏｐｙｆｕｚｚｙＣｍｅａｎｓｃｌｕｓｔｅｒｉｎｇ

，ＣＥＦＣＭ），采用交叉熵有效度

量各类样本隶属度之间的差异性，使目标函数通过优化所获得

的划分矩阵中每个样本隶属度不仅受距离影响，而且还受制于

交叉熵。

１　模糊交叉熵

基于Ｋｕｌｌｂａｃｋ

［１９］

在信息论中对交叉熵的定义，对于论域

Ｘ＝｛ｘ

１

，ｘ

２

，…，ｘ

ｎ

｝的两个模糊集Ａ和Ｂ，Ａ相对于Ｂ的模糊交

叉熵的对称形式定义为

Ｄ（Ａ，Ｂ）＝

∑

Ｎ

ｉ

＝１

Ａ

（ｘ

ｉ

）ｌｎ

Ａ

（ｘ

ｉ

）

Ｂ

（ｘ

ｉ

）

＋

∑

Ｎ

ｉ

＝１

Ｂ

（ｘ

ｉ

）ｌｎ

Ｂ

（ｘ

ｉ

）

Ａ

（ｘ

ｉ

）

（１）

其中：

Ａ

（ｘ

ｉ

）和

Ｂ

（ｘ

ｉ

）表示Ｘ中元素ｘ

ｉ

分别属于Ａ或Ｂ的隶

属度。

交叉熵是下凸函数，当Ａ或Ｂ完全一致时可取得最小零

值。尽管交叉熵不是真正意义上的几何距离，但是用来度量模

第３６卷第１０期

２０１９年１０月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ３６Ｎｏ１０

Ｏｃｔ．２０１９

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38516270

粉丝: 3
资源: 1011

鲁棒模糊聚类新算法：基于交叉熵优化

基于改进模糊聚类算法鲁棒的图像分割.pdf

鲁棒模糊方向聚类算法RFDSC：文本数据的有效处理策略

"基于鲁棒加权模糊聚类的污水处理过程监测方法及可持续发展探索

自适应融合策略的多视角模糊聚类算法

改进的混合蛙跳与阴影集粗模糊聚类算法提升聚类性能

基本聚类算法套件FCPS的软件库及其在聚类分析中的应用

K-means聚类算法和FCM聚类算法的优缺点对比

对比，深度嵌入图像聚类算法，深度无监督图像聚类算法，深度子空间图像聚类算法的效率，复杂度，图像聚类程度，准确率

比较和分析原型聚类算法和密度聚类算法

模糊聚类和kmeans聚类对比

最新资源