收稿日期 修回日期 基金项目 山东省 科 技 攻 关项目 GG济南 市 高 校院所自 主 创 新项目
山东省软科学研究计划项目RKA
作者简介刘雷 男硕士研究生主要研究方向为聚类分析计算智能 等 kyzhuanyongcom 王洪国教授博导主要研究方向
为数据挖掘电子政务组合优化算法等邵增珍讲师博士研究生主要研究方向为计算智能人工智能等尹会娟硕士研究生主要研究方向为
计算智能博弈理论等
一 种 基 于 蜂 群 原 理 的 划 分 聚 类 算 法
刘雷
a
王洪国
a b
邵增珍
b
尹会娟
a
山东师范大学 a管理与经济学院 b信息科学与工程学院 济南 山东省分布式计算机软件新
技术重点实验室 济南
摘要 针对现有的大部分划分聚类算法受聚类簇的个数 的限制提出一种基于蜂群原理的划分聚类算法
该方法通过引入蜂群采蜜机制将聚类中心视为食物源通过寻找食物源的自组织过程来实现数据对象的聚集
在聚类的过程中引入紧密度函数来评价聚类中心 局部引入分离度函数来确定最佳聚类簇的个数 全局
与传统的划分聚类算法相比本算法无须指定聚类个数即可实现聚类过程 通过仿真实验表明提出的算法不
但对最佳聚类数有良好的搜索能力而且有较高的准确率算法时间复杂度仅为
具有较高
的执行效率
关键词 聚类 划分聚类 人工蜂群 紧密度 分离度
中图分类号 TPTP文献标志码 A文章编号
doi jissn
Partition clustering algorithm based on artificial bee colony principal
LIU Lei
a
WANG Hongguo
ab
SHAO Zengzhen
b
YIN Huijuan
a
& &
Abstract According to the drawback that most of these algorithms had the shortcoming that clustering results were limited by
value which was the number of clusters this paper proposed a new partition clustering algorithm based on the principal of ar
tificial bee colonyThe clustering method introduced the mechanism of artificial bee colony collecting pollen and every cluste
ring center would be considered as a food sourceThen the process of gathering data objects would be achieved by the process
of finding the food sourceIn the process of clustering proposed tightness function as the fitness to evaluate the cluster center
local and itroduced separation function to determine the optimal number of clusters globalComapared to traditional par
tition clustering algorithms this algorithm did not need the value that was a given number of clusters to realize clustering
processSimulation results show that the algorithm not only can determine the best number of clusters and can get a higher
clustering accuracyFurthermore the time complexity of this algorithm is
which is with high efficiency
in the implementation
Key words clustering partition clustering artificial bee colonyABC tightness separation
0引言
聚类分析是一种重要的分析数据的方法它是将物理的或
抽象的对象集合分成相似的对象类的过程 现有的大部分聚
类算法尤其是划分聚类算法受初值的影响比较大即不同的
初值会产生不同的结果且往往需要预先给定聚类簇的个数
但实际上聚类簇的个数有时是难以提前预知的这导致现有的
划分聚类方法难以有效进行 探索新的更有效的聚类算法以
实现数据集的有效聚集是一个亟待解决的问题
在众多聚类方法中划分聚类方法是一种非常重要的聚类
方法 如 Kmeans
PAM
以及在此基础上改进的一些算
法
等 这些聚类算法虽然取得了较好的聚类效果但是其
始终受聚类数 值的限制对不明确聚类数 值的一些数据
集不具有普适性同时上述算法常常终止于局部最优解 文献
提出了一种基于数据场的聚类方法不用给定 值就可以
完成聚类取得了较好的聚类效果但是复杂度较高为
不适用于大规模数据集的有效聚集
当前已经有一些研究者将智能优化算法应用到聚类问题
当中 文献将粒子群算法和蚁群算法应用于聚类问题
证明了智能优化算法可以有效地解决聚类问题 在现有的智
能优化算法中人工蜂群算法是 Basturk 等人
在 年提出
的一种 新 型 算 法 该 算 法 具 有 自 组 织 性 和 收 敛 性 好 的 特
点
且不易陷入局部最优
基于人工蜂群算法的优点
本文提出一种新的聚类算法
1聚类问题及人工蜂群算法概述
11聚类问题
在数域空间
存在具有 个数据 对象的 数据集
第 卷第 期
年 月
计 算 机 应 用 研 究
Application Research of Computers
Vol No
May