自组织蜂群算法：无K值约束的划分聚类新方法

需积分: 18 161 浏览量更新于2024-08-12 收藏 740KB PDF 举报

"该资源是一篇2011年的工程技术论文，主要介绍了一种创新的划分聚类算法，该算法受到蜂群行为的启发，能够自动寻找最优的聚类簇数量，无需预先设定。该算法引入了蜂群采蜜机制，以聚类中心为食物源，通过模拟蜜蜂寻找食物源的过程进行数据聚集。同时，它利用紧密度函数评估局部聚类中心的质量，以及分离度函数确定全局的最佳聚类簇数目。实验结果表明，该算法在搜索最佳聚类数和准确性方面表现出色，且时间复杂度低，执行效率高。该研究由山东省科技攻关项目、济南市高校院所自主创新项目和山东省软科学研究计划项目资助。作者们分别在聚类分析、计算智能、数据挖掘和人工智能等领域有所研究。" 这篇论文探讨的核心知识点包括： 1. **划分聚类算法**：这是一种数据挖掘中的重要方法，它将数据集划分为若干个互斥的子集（簇），每个数据点都属于一个簇，且簇内的数据点相似度较高，而不同簇之间的数据点相似度较低。 2. **聚类簇数K的限制**：传统划分聚类算法如K-means需要预先设定簇的数量K，这在实际应用中可能不切实际，因为最佳簇数往往未知。 3. **蜂群原理**：论文借鉴了自然界中蜂群的行为模式，将其应用于聚类算法中，以解决K值的不确定性问题。蜜蜂寻找食物源的过程被用来模拟数据对象的聚集。 4. **蜂群采蜜机制**：在算法中，聚类中心被比作食物源，数据对象则像蜜蜂一样通过自我组织寻找并聚集到最接近的食物源，即聚类中心。 5. **紧密度函数**：这是评价聚类中心质量的一个局部指标，用于衡量数据点与聚类中心的接近程度，帮助判断数据点是否应该归属到特定的簇。 6. **分离度函数**：这是一个全局指标，用于确定最佳的聚类簇个数。通过比较不同聚类方案的分离度，可以找到使簇间差异最大的划分，从而确定最佳的K值。 7. **无需预设聚类个数**：算法的创新之处在于，它能自动搜索最佳的聚类数，避免了人为设定K值的局限性。 8. **算法效率**：实验结果显示，尽管引入了新的评价机制，算法的时间复杂度仍保持在O(n×k^3)，其中k远小于n，意味着算法在大数据集上也能高效运行。 9. **实验验证**：通过仿真实验，该算法的性能得到了验证，不仅在搜索最佳聚类数方面表现优秀，而且在准确性上也有较高水平，体现了算法的有效性和实用性。 10. **应用背景**：论文的作者们来自不同的研究领域，如聚类分析、计算智能、数据挖掘和人工智能，暗示了这种基于蜂群原理的聚类算法可能在这些领域有广泛的应用潜力。

收稿日期  修回日期  基金项目 山东省科技攻关项目 GG济南市高校院所自主创新项目

山东省软科学研究计划项目RKA

作者简介刘雷 男硕士研究生主要研究方向为聚类分析计算智能等 kyｚhuanyongcom 王洪国教授博导主要研究方向

为数据挖掘电子政务组合优化算法等邵增珍讲师博士研究生主要研究方向为计算智能人工智能等尹会娟硕士研究生主要研究方向为

计算智能博弈理论等

一种基于蜂群原理的划分聚类算法



刘雷

a

 王洪国

a b

 邵增珍

b

 尹会娟

a

山东师范大学 a管理与经济学院 b信息科学与工程学院 济南  山东省分布式计算机软件新

技术重点实验室 济南 

摘要 针对现有的大部分划分聚类算法受聚类簇的个数  的限制提出一种基于蜂群原理的划分聚类算法

该方法通过引入蜂群采蜜机制将聚类中心视为食物源通过寻找食物源的自组织过程来实现数据对象的聚集

在聚类的过程中引入紧密度函数来评价聚类中心 局部引入分离度函数来确定最佳聚类簇的个数 全局

与传统的划分聚类算法相比本算法无须指定聚类个数即可实现聚类过程 通过仿真实验表明提出的算法不

但对最佳聚类数有良好的搜索能力而且有较高的准确率算法时间复杂度仅为   



  具有较高

的执行效率

关键词 聚类 划分聚类 人工蜂群 紧密度 分离度

中图分类号 TPTP文献标志码 A文章编号 

doi jissn

Partition clustering algorithm based on artificial bee colony principal

LIU Lei

a

 WANG Hongguo

ab

 SHAO Zengｚhen

b

 YIN Huijuan

a

   &      &      

             

Abstract According to the drawback that most of these algorithms had the shortcoming that clustering results were limited by

 value which was the number of clusters this paper proposed a new partition clustering algorithm based on the principal of ar

tificial bee colonyThe clustering method introduced the mechanism of artificial bee colony collecting pollen and every cluste

ring center would be considered as a food sourceThen the process of gathering data objects would be achieved by the process

of finding the food sourceIn the process of clustering proposed tightness function as the fitness to evaluate the cluster center

local and itroduced separation function to determine the optimal number of clusters globalComapared to traditional par

tition clustering algorithms this algorithm did not need the value  that was a given number of clusters to realiｚe clustering

processSimulation results show that the algorithm not only can determine the best number of clusters and can get a higher

clustering accuracyFurthermore the time complexity of this algorithm is  



  which is with high efficiency

in the implementation

Key words clustering partition clustering artificial bee colonyABC tightness separation

0引言

聚类分析是一种重要的分析数据的方法它是将物理的或

抽象的对象集合分成相似的对象类的过程 现有的大部分聚

类算法尤其是划分聚类算法受初值的影响比较大即不同的

初值会产生不同的结果且往往需要预先给定聚类簇的个数

但实际上聚类簇的个数有时是难以提前预知的这导致现有的

划分聚类方法难以有效进行 探索新的更有效的聚类算法以

实现数据集的有效聚集是一个亟待解决的问题

在众多聚类方法中划分聚类方法是一种非常重要的聚类

方法 如 Kmeans

 

PAM



以及在此基础上改进的一些算

法

 

等 这些聚类算法虽然取得了较好的聚类效果但是其

始终受聚类数  值的限制对不明确聚类数  值的一些数据

集不具有普适性同时上述算法常常终止于局部最优解 文献

提出了一种基于数据场的聚类方法不用给定  值就可以

完成聚类取得了较好的聚类效果但是复杂度较高为 





不适用于大规模数据集的有效聚集

当前已经有一些研究者将智能优化算法应用到聚类问题

当中 文献将粒子群算法和蚁群算法应用于聚类问题

证明了智能优化算法可以有效地解决聚类问题 在现有的智

能优化算法中人工蜂群算法是 Basturk 等人



在  年提出

的一种新型算法 该算法具有自组织性和收敛性好的特

点

 

且不易陷入局部最优



 基于人工蜂群算法的优点

本文提出一种新的聚类算法

1聚类问题及人工蜂群算法概述

11聚类问题

在数域空间 



存在具有  个数据对象的数据集  

第  卷第  期

 年  月

计算机应用研究

Application Research of Computers

Vol No

May 

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38742453

粉丝: 15
资源: 945

自组织蜂群算法：无K值约束的划分聚类新方法

蜂群算法与k-means聚类结合优化算法.rar

基于变异精密搜索的蜂群聚类算法

基于模糊C-均值的改进人工蜂群聚类算法 (2016年)

基于改进流形距离和人工蜂群的二阶段聚类算法

【数据聚类】基于改进人工蜂群算法的K均值聚类算法Matlab代码.rar

基于K_means的改进人工蜂群聚类算法

IABC_KMC_test_on_Iris_wine_glass_人工蜂群_人工蜂群算法K均值聚类算法_改进_k聚类改进_win

基于蜂群原理的自适应划分聚类算法：无K值限制与高效性能

障碍约束下人工蜂群空间聚类算法研究

基于改进人工蜂群算法的K均值聚类算法-喻金平-郑杰-梅宏标1

最新资源