聚类分析算法详解：最邻近规则与最大最小距离法

5星 · 超过95%的资源需积分: 9 183 浏览量更新于2024-09-13 收藏 111KB PDF 举报

"本文主要介绍了两种聚类分析算法：基于试探的位置类别聚类算法中的最邻近规则试探法和最大最小距离算法。这两种方法都是在无监督学习中用于数据分组的方法，旨在发现数据内在的结构和模式。" 在聚类分析中，目标是根据数据的相似性或差异性将其分为不同的组，即“簇”。这里，我们重点关注两种算法： 1. **最邻近规则的试探法**：这是一种迭代算法，它首先选择一个样品作为初始聚类中心，然后根据样品与已有聚类中心的距离进行分类。具体步骤如下： - **初始化**: 选择一个样品作为第一个聚类中心，并记录当前聚类中心的数量（centerNum = 1）。 - **距离计算**: 对所有样品，计算它们与所有聚类中心的距离，找出最近的聚类中心（最小值Dj）。 - **分类**: 如果样品到最近聚类中心的距离Dj小于阈值T，则将样品分配到该聚类；如果距离大于等于T，则创建新聚类并将样品作为新的聚类中心。 - **更新聚类中心**: 每次分类后，根据类内样品的平均特征值更新聚类中心。 - **重复以上步骤**，直至所有样品被分类，输出最终的分类结果。 2. **最大最小距离算法**：这种算法选择最远的样品作为下一个聚类中心，以确保每个聚类的边界最大化。步骤如下： - **初始化**: 将第一个样品设为第一个聚类中心，记为m_center(1)，并设置其类别索引为1，centerNum = 1。 - **寻找最远样品**: 找到与当前聚类中心m_center(1)具有最大距离的样品，设为新的聚类中心，增加centerNum。 - **创建新聚类**: 更新新聚类中心的特征值，并将最远样品的类别设置为新的聚类号。 - **重复过程**：继续寻找下一个最远的样品，形成新的聚类，直到所有样品都被分配到某个聚类。这两种算法都依赖于距离度量（如欧氏距离），并且都需要设定一个阈值T或采用特定的策略来确定何时停止聚类。最邻近规则的试探法侧重于找到最近的聚类，而最大最小距离算法则追求聚类之间的最大间隔。在实际应用中，选择哪种算法取决于数据的特性以及对聚类结果的期望。

9.2.基于试探的位置类别聚类算法

9.2.1 最邻近规则的试探法

实现步骤：

设有 N 个样品：m_pattern(1)，m_pattern(2)，...，m_pattern(patternNum)，

patternNum=N。

（1）选一个样品作为第一个聚类中心 m_center(1).fearure,不妨令

(1).feature=m

pattern(1).featuremcenter

。

centerNum 记录当前中心的数目，centerNum=1。

（2）通过对话框读入阀值 T 并输出所有样品之间的最大最小距离作为 T 的参考。

（3）对所有样品：计算该样品 m_pattern(i)到所有聚类中心 m_center(j)的距离，

找到最小值 D

(0≤j<centerNum)。

若 D

<T,则将该样品 m_pattern(i)归入第 j 类，即

(i).cate

center(

).indexpattern

代表第 j 类的样品数量，由于增加一个样品，因此，N

++。并且修改第 j

个聚类中心的值：

(j)=

center X

∈

∑

若 Dj≥T，建立新的聚类中心，聚类中心数目（centerNum）增加，因此 centerNum++。

(centerNum).feature=m

pattern(i).featuremcenter

pattern(i).cate

=centerNum

。

（4）输出分类结果。

9.2.2 最大最小距离算法

实现步骤：

（1）选一个样品作为第一个聚类中心 m_center(1)，以第一个样品的特征值作为

第一个中心的特征值，当前类中心的特征值数目为 1。

(1).feature=m

pattren(1).featurem center ，

(1). =1m center index

不妨令 m_pattern.category=1。centerNum 记录当前类的数目，centerNum=1.

（2）查找离 m_center(1)最远的样品 m_pattern(i)，设最大距离为 maxdistance。

令最远的样品 m_pattern(i)为第二个类，增加一个中心个数 centerNum++；

下载后可阅读完整内容，剩余4页未读，立即下载

oGuangMingShiZhe1

粉丝: 0
资源: 1

聚类分析算法详解：最邻近规则与最大最小距离法

C++在聚类分析中的应用

欧式距离聚类分析

模糊聚类分析及应用的C++实现

FCM+KFCM 模糊C均值聚类分析算法 matlab

模糊聚类分析算法的改进Matlab语言程序设计.pdf

DBSCAN_matlab:Matlab中DBSCAN聚类分析算法的实现

co-attachment聚类分析算法(源码以及可执行文件)

基于云计算架构的西藏生态数据聚类分析算法研究.pdf

基于聚类分析算法的铁路通信设备厂商信息智能分类.pdf

R语言实现聚类分析算法的研究

最新资源