使用Matlab实现模糊C均值聚类算法实例与详解

下载需积分: 50 | TXT格式 | 5KB | 更新于2024-09-11 | 199 浏览量 | 举报

模糊C均值聚类（Fuzzy C-Means, FCM）是一种基于模糊集合理论的无监督机器学习算法，用于数据集的分簇。在MATLAB中，实现这一算法的函数`FCMClust.m`允许用户对给定的数据集进行聚类分析。该函数接收四个主要输入参数： 1. **data**: 一个nxm矩阵，其中n表示样本数量，m代表特征维度。这是输入数据集，通常包含了待聚类的观测值。 2. **cluster_n**: 整数，指定期望的聚类数量。这个参数告诉算法将数据分成多少个模糊簇。 3. **options**: 一个4x1的结构体，包含算法运行的可选参数： - `options(1)`：设置初始隶属度矩阵U的最大值，通常大于1（如默认值2.0），用于控制聚类的模糊程度。 - `options(2)`：迭代次数上限，默认值为100次，控制算法的收敛速度。 - `options(3)`：停止准则的绝对误差阈值，默认为1e-5，当聚类中心的变化小于这个阈值时，算法停止迭代。 - `options(4)`：是否显示聚类结果（默认为1），可以选择关闭输出结果以提高效率。函数的输出包括： - **center**: 聚类中心的矩阵，每个行表示一个簇的中心，列对应于特征维度。 - **U**: 属性隶属度矩阵，矩阵中的每个元素表示样本与相应簇中心的模糊关联程度。 - **obj_fcn**: 目标函数值，即聚类误差平方和，反映了聚类效果的好坏。在示例部分，函数首先创建一个随机数据集`data`，然后调用`FCMClust`函数，指定两个簇的数量。接着，它绘制原始数据点、最高隶属度的簇中心以及簇内的极值点，直观地展示聚类结果。通过这个函数，用户可以灵活地调整参数以适应不同的数据集和分析需求。使用`FCMClust`函数时，理解并调整这些参数是至关重要的，因为它们直接影响到聚类的质量和效率。在实际应用中，可能还需要对数据预处理、选择合适的聚类数量（如有肘部法则）、以及比较不同聚类算法的效果进行综合考虑。

function [center, U, obj_fcn] = FCMClust(data, cluster_n, options)
% FCMClust.m 采用模糊C均值对数据集data聚为cluster_n类
% 用法：
% 1. [center,U,obj_fcn] = FCMClust(Data,N_cluster,options);
% 2. [center,U,obj_fcn] = FCMClust(Data,N_cluster);
% 输入：
% data ---- nxm矩阵,表示n个样本,每个样本具有m的维特征值
% N_cluster ---- 标量,表示聚合中心数目,即类别数
% options ---- 4x1矩阵，其中
% options(1): 隶属度矩阵U的指数，>1 (缺省值: 2.0)
% options(2): 最大迭代次数 (缺省值: 100)
% options(3): 隶属度最小变化量,迭代终止条件 (缺省值: 1e-5)
% options(4): 每次迭代是否输出信息标志 (缺省值: 1)
% 输出：
% center ---- 聚类中心
% U ---- 隶属度矩阵
% obj_fcn ---- 目标函数值
% Example:
% data = rand(100,2);
% [center,U,obj_fcn] = FCMClust(data,2);
% plot(data(:,1), data(:,2),'o');
% hold on;
% maxU = max(U);
% index1 = find(U(1,:) == maxU);
% index2 = find(U(2,:) == maxU);
% line(data(index1,1),data(index1,2),'marker','*','color','g');
% line(data(index2,1),data(index2,2),'marker','*','color','r');
% plot([center([1 2],1)],[center([1 2],2)],'*','color','k')
% hold off;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

下载后可阅读完整内容，剩余4页未读，立即下载