2013,49(22)
改进的粒子群模糊聚类算法
钱雪忠,李 静,宋 威
QIAN Xuezhong, LI Jing, SONG Wei
江南大学 物联网工程学院,江苏 无锡 214122
School of Internet of Things Engineering, Jiangnan University, Wuxi, Jiangsu 214122, China
QIAN Xuezhong, LI Jing, SONG Wei. Improved fuzzy clu stering algor ithm based on particle swarm optimization. Com-
puter Engineering and Applicat ions, 2013, 49(22):115-118.
Abs tract:Aiming at the problem of traditional fuzzy C-means clustering algorithm that it is sensitive to the initial clustering
centers and easy to fall into the local optimizati on, an improved algorithm that combi nes Particle Swarm Optimization algorithm
with FCM algorithm is proposed. Depending on utilizing the global searc hing ability of Part icle Swarm Optimi zation algorithm
instead of the FCM algorithm, the new alg orithm searches the initial cluster ce nters and escapes from the local optimization so
as to achieve fuzzy clu stering at last. Meanwhile, it mainly redesigns the fitness function from th e perspective of compactness in
intra-class and separation in inter-class. The experimenta l results show that the pro posed algorithm has a better effect on both the
cluster validity indexes and clus ter ing accuracy.
Key words:fuzzy c lustering; Fuzzy C-means(FCM); Particle Swarm Optimization(PSO); compactness; separation
摘 要:针对传统的模糊 C -均值聚类算法对初始聚类中心较敏感、易陷入局部最优的缺点,将粒子群优化算法和 FCM 算
法相结合,提出一种改进的模糊聚类算法。该算法利用粒子群算法的全局搜索能力代替 FCM 算法寻找初始聚类中心,使
其跳出局部最优,实现模糊聚类。主要从反映数据集分类的类内紧致性程度和类间分离性程度的角度考虑,重新设计适
应度函数。实验结果表明,提出的算法在聚类正确率和有效性指标上有更好的效果。
关键词:模糊聚类;模糊 C-均值聚类算法;粒子群优化算法;紧凑性;分离性
文献标志码:A 中图分类号:TP1 8 doi:10.3778/j.issn.1002-8331.1304-0211
基金项目:国家自然科学基金(No.61103129,No.61202312);江苏省科技支撑计划资助项目(No.BE2009009)。
作者简介:钱雪忠(1967—),男,副教授,硕导,主要研究方向:数据库技术、数据挖掘、网络计算;李静(1987—),女,硕士研究生,主要研究方向:
模糊聚类;宋威(1981—),男,博士,副教授,硕导,主要研究方向:数据挖掘,机器学习,信息检索,模式识别。E-mail:hellojingli@126.com
收稿日期:2013-04-14 修回日期:2013-07-15 文章编号:1002-8331(2013)22-0115-04
CNKI 出版日期:2013-08-28 http://www.cnki.net/kcms/detail/11.2127.TP.2 0130828.1540.001.html
1 引言
聚类分析是按照一定的准则,通过特定的算法,对给
定的数据集进行分类,使得同一类中样本的相似性尽可能
的小,而不同类之间的样本差异性尽可能的大。聚类分析
已被广泛应用到了数据分析、模式识别、图像处理等多个
领域
[1]
。传统的聚类分析是一种硬划分,聚类结果是非常
明确的,即一个样本只能完全属于某一个类或完全不属于
某个类。但是在现实生活中,许多事物之间是没有明确的
界限,适合软划分,即模糊聚类。在模糊聚类中,每个样本
都以一定的概率(隶属度)从属于所有类,表现了样本类属
的模糊性,能够比较客观地反映现实世界。目前,模糊 C 均
值(FCM)聚类算法是一种理论和应用较为完善、较为广泛
的模糊聚类算法,但是 FCM 是一种局部搜索算法。由于对
初始聚类中心是随机选择的,所以不同的初始值对应不同
的聚类结果 。如果 初始值选取 不当,则会陷 入局部 极小
值 ,就 得 不 到 全 局 最 优 解 ,从 而 限 制 了 该 算 法 的 实 际 应
用。针对这 些缺点 ,目前 已经提 出多种可行 性方案 。其
中,一种方案是将智能进化算法引入,达到全局寻优的目
的,形成了基于进化计算的模糊聚类算法,主要有基于模
拟退火
[2]
、遗传算法
[3]
和进化策略
[4]
的方法等。其中,PSO 算
法是一种较新的全局优化算法,已经引起多个领域的广泛
关注。与其他进化算法相比,该算法具有收敛速度快、设
置参数少、程序实现异常简洁、具有深刻的智能背景等特
点,并且在很多情况下比遗传算法效果更好。文献[5]将遗
传算法得到的聚类中心作为 FCM 聚类算法的初值,解决了
FCM 算法和遗传算法各自的缺点,并在通信信号的星座聚
类中得到了很好的效果。文献[6]是利用 PSO 算法对 PAM
进行优化,在给出的实验数据集上取得了较好的效果。目
C omputer Engineering and Ap plications 计算机工程与应用
115