多变量k-means聚类算法python

以下是多变量K-means聚类算法的Python实现： ```python import numpy as np class KMeansClassifier(): """初始化KMeansClassifier类""" def __init__(self, k=3, initCent='random', max_iter=500): # 类的成员变量 self._k = k # 簇的个数 self._initCent = initCent # 初始化簇质心的方法 self._max_iter = max_iter # 最大迭代次数 def fit(self, X): m, n = np.shape(X) # 初始化簇质心 if self._initCent == 'random': centroids = self._randCent(X, self._k) elif self._initCent == 'kmeans++': centroids = self._kmeansPlusPlus(X, self._k) else: raise NameError('The initialization method is not recognized') # 初始化其他变量 clusterAssment = np.zeros((m, 2)) # 存储每个样本的簇分配结果和平方误差 clusterChanged = True # 簇分配结果是否改变的标志 iter_count = 0 # 当前迭代次数 # 迭代计算 while clusterChanged and iter_count < self._max_iter: clusterChanged = False iter_count += 1 # 对每个样本进行簇分配 for i in range(m): minDist = np.inf minIndex = -1 for j in range(self._k): distJI = self._euclideanDist(X[i, :], centroids[j, :]) if distJI < minDist: minDist = distJI minIndex = j if clusterAssment[i, 0] != minIndex: clusterChanged = True clusterAssment[i, :] = minIndex, minDist ** 2 # 更新簇质心 for j in range(self._k): pointsInCluster = X[np.nonzero(clusterAssment[:, 0] == j)[0]] centroids[j, :] = np.mean(pointsInCluster, axis=0) self._centroids = centroids self._clusterAssment = clusterAssment self._iter_count = iter_count def predict(self, X): m, n = np.shape(X) clusterAssment = np.zeros((m, 2)) for i in range(m): minDist = np.inf minIndex = -1 for j in range(self._k): distJI = self._euclideanDist(X[i, :], self._centroids[j, :]) if distJI < minDist: minDist = distJI minIndex = j clusterAssment[i, :] = minIndex, minDist ** 2 return clusterAssment[:, 0] def _randCent(self, X, k): n = np.shape(X)[1] centroids = np.mat(np.zeros((k, n))) for j in range(n): minJ = np.min(X[:, j]) rangeJ = float(np.max(X[:, j]) - minJ) centroids[:, j] = np.mat(minJ + rangeJ * np.random.rand(k, 1)) return centroids def _kmeansPlusPlus(self, X, k): m, n = np.shape(X) centroids = np.mat(np.zeros((k, n))) centroids[0, :] = X[np.random.randint(m), :] for i in range(1, k): dist = np.mat(np.zeros((m, i))) for j in range(i): dist[:, j] = np.mat(self._euclideanDist(X, centroids[j, :])) minDist = np.min(dist, axis=1) probs = minDist / np.sum(minDist) cumulativeProbs = np.cumsum(probs) rand = np.random.rand() index = np.nonzero(cumulativeProbs >= rand)[0][0] centroids[i, :] = X[index, :] return centroids def _euclideanDist(self, A, B): return np.sqrt(np.sum(np.power(A - B, 2))) ```

多变量k-means聚类算法python

相关推荐

基于k-means聚类算法的分布式能源系统典型日冷热负荷选取.pdf

K均值聚类(KMeans)算法(Python)

Python实现机器学习算法

k-means聚类算法python输出轮廓系数

K-means聚类算法实现,用python代码展示1. 采用莺尾花数据，学习决策树。 2.画出决策树

python 读取csv文件 用k-means算法聚类

使用excel文件中的莺尾花数据，学习决策树。画出决策树，K-means聚类算法实现

基于python，分别采用K-means和GMM聚类算法编程来说明GMM聚类算法的优势

kmeans聚类算法python iris

k-means++三维聚类

kmeans聚类算法python实现鸢尾花

python k-means

K-MEANS，手动指定聚类中心代码

python使用K-Means算法对用户画像特征进行聚类，使用轮廓系数法确定最佳的聚类数量。

tslearn 多变量聚类python 代码

利用k-means算法完成Iris数据集的聚类，并输出聚类结果的正确率和召回率。并写出代码

利用k-means算法对UCI数据库中Car Evaluation数据集聚类的代码

分类型变量python聚类分析_用python对包含分类变量和数值变量的数据进行聚类的最佳方法是什么...

最新推荐

京瓷TASKalfa系列维修手册：安全与操作指南

管理建模和仿真的文件

【进阶】入侵检测系统简介

轨道障碍物智能识别系统开发

小波变换在视频压缩中的应用

"互动学习：行动中的多样性与论文攻读经历"

【进阶】Python高级加密库cryptography

linuxjar包启动脚本

Microsoft OfficeXP详解：WordXP、ExcelXP和PowerPointXP

关系数据表示学习

python 读取csv文件用k-means算法聚类