蚁群优化的k-means聚类算法研究与改进

需积分: 9 7 浏览量更新于2024-08-11 收藏 233KB PDF 举报

"一种新的基于蚁群原理的聚类算法 (2008年) - 扬州大学学报(自然科学版)" 这篇文章介绍了一种创新的聚类算法，该算法结合了蚁群优化原理和经典的k-means算法，旨在提高聚类分析的质量。聚类分析是数据挖掘中的一个重要步骤，其目标是将数据自动分组，使得同一组内的数据彼此相似，而不同组间的数据差异较大。k-means算法是最常用的聚类方法之一，但它有两个主要缺点：需要预先设定类别数量k，以及对初始聚类中心的选择敏感。在改进的算法中，研究者首先对k-means进行了优化，以克服上述问题。接着，他们引入了蚁群算法的概念，特别是蚂蚁在寻找最短路径时的信息素传播机制。蚁群算法是一种全局优化方法，能够有效地避免陷入局部最优解，这正是解决k-means算法易受局部最优影响的关键。在聚类过程中，每个数据点被视为蚂蚁，而数据空间的不同区域则代表可能的路径。每只“蚂蚁”（数据点）根据信息素浓度（即数据点与聚类中心的相似度）选择最有可能属于的类别，同时更新信息素的分布。这个过程反复进行，直到算法达到某种停止条件，如达到预定的迭代次数或信息素稳定。实验结果显示，这种结合了蚁群优化的k-means算法在聚类效果上优于传统的k-means算法，特别是在处理大规模复杂数据集时，能更好地发现数据的内在结构，提供更准确的聚类结果。关键词涉及到的聚类、蚁群算法和k-means算法是本文讨论的核心。聚类是数据挖掘的基础工具，蚁群算法作为一种全局优化技术，被用来改进聚类过程的效率和准确性，而k-means则是最常用的聚类算法之一，但它的局限性促成了对其改进的需求。文献分类号TP311.13和文献标识码A表明这是计算机科学和技术领域的学术论文，具体在数据处理和信息检索方面。文章编号1007-824X(2008)02-0057-04是该论文的唯一标识，用于引用和检索。总结来说，这篇2008年的论文提出了一种新的聚类策略，通过融合蚁群算法的全局优化能力和k-means算法的高效性，为大数据分析提供了更强大的聚类工具，对于理解和应用聚类方法在实际问题中有着重要的价值。

第

卷第

期

2008

年

月

扬州大学学报(自然科学版)

Joum"l

of Yangzhou University (Natural

ience EditionJ

一种新的基于蚁群原理的聚类算法

孙多

陈志敏

，沈

吉

(扬州大学

信息工程学院;

信息中心，江苏扬州

225009)

No.2

扎

1ay

2008

摘

要:为了改善聚类分析的质量，提出一种与蚁群原理相结合的聚类方法.首先对传统的聚类算法

k-means

进行改进，克服传统的

k-means

算法必须事先确定分类的个数

和选择聚类点的缺陷，然后将蚁群

算法的转移概率引人

k-means

算法，对上述聚类结果进行二次优化.实验结果表明，改进的

k-means

与蚁群

算法相结合的聚类方法比单一聚类算法更有效.

关键词:聚类

蚁群算法

k-means

算法

中圈分类号:

311.13

文献标识码

文章编号:

1007

824X(2008)02

0057

- 04

蚁群算法是近年来首先由意大利学者

OORIGO

等人提出的模拟进化算法，它是一种新型的优化

方法，具有全局优化能力.由于传统的聚类算法在解决实际大规模问题时容易陷入局部最优解，所以

许多研究者尝试将全局性收敛较好的蚁群算法引人聚类分析.最早在这一领域开展工作的是

DENEUBOURG

等人[川他们提出蚁巢分类模型，并应用在机器人控制及数据分析中.后来

LUMER

和

FAIETA[2]

将基于蚁巢分类模型的聚类算法应用于银行客户数据分析，进行贷款风险评

测.目前用于聚类分析的蚁群算法主要分为两类:一是灵感源于蚂蚁觅食的蚁群路由选择算法

叫;

二是灵感源于蚂蚁堆积尸体和幼体的

算法阳的及其改进

[5]

在研究过程中，人们发现这些算法存

在聚类速度慢、容易陷入局部最优解等不足.因此，本文在此基础上，提出一种新的结合蚁群算法的

聚类新方法.

基于蚁群原理的聚类模型的思想及算法描述

1. 1

基本的蚁群算法

蚂蚁觅食时，从蚁巢到食物源有很多条道路，开始时不同的蚂蚁会选择不同的路径，而到了最后，

几乎所有的蚂蚁都会找到同一条最短的路线.究其原因，是由于蚂蚁寻找最短路径的过程是一个交

互式的过程，所有的蚂蚁都会在它们经过的路上留下一定量的信息素;还有一点就是蚂蚁能够感知

这种信息素的存在及其数量，并且选择信息素最多的那条路径.因此，这些信息素既会随着通过该条

路径的蚂蚁数量的变化而变化，也会随着时间的流逝而按照一定的函数关系消逝.由于最短路径上

通过的蚂蚁数量较多，所以其上信息素的积累速度也比其他路径快.因此，蚁群之间通过信息素不断

地交流反馈信息，最终找到一条从蚁巢到食物源的最短路径.这就是蚁群算法的基本原理.借鉴这

一原理，将数据视为具有不同属性的蚂蚁，聚类中心视为蚂蚁所要寻找的"食物源"，数据聚类过程就

可看作是蚂蚁寻找食物源的过程山

聚类问题的蚁群算法思路如下

[6]

模式样本分配给第

个聚类中心

z/j=1.2.

…，剖，蚂蚁就在

模式样本

到聚类中心巧的路径上留下信息素刊，求出第

个蚂蚁选择聚类中心

的概率.算法

如下:

收稿日期:

2007 -

基金项目

国家自然科学基金资助项目

(60673060)

拎联系人.

E-mail:

sunduo@yzu.edu.cn

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38679277

粉丝: 6

蚁群优化的k-means聚类算法研究与改进

基于蚁群模糊聚类算法的图像边缘检测

论文研究-核蚁群化学聚类算法.pdf

蚁群聚类算法

蚁群聚类算法和k-means算法比较实验

蚁群聚类算法python

用蚁群聚类算法实现数据的聚类与可视化

基于密度的聚类算法有哪些

DPC聚类算法与CDP聚类算法

有哪些好用的基于密度的聚类算法

蚁群算法 聚类分析 matlab代码

最新资源

蚁群算法聚类分析 matlab代码