使用python手动实现k-means聚类

首先，我们需要生成一些随机数据来进行聚类。这里我们生成了100个二维数据点，分为两个簇。 ```python import numpy as np import matplotlib.pyplot as plt np.random.seed(42) # 生成随机数据 X = np.random.randn(100, 2) X[:50, 0] += 5 X[:50, 1] -= 5 # 绘制数据散点图 plt.scatter(X[:, 0], X[:, 1]) plt.show() ``` ![image-20211108142335908](https://i.loli.net/2021/11/08/2lWq3wFJrDmOZKj.png) 接下来，我们可以手动实现k-means算法。首先，我们需要随机初始化k个聚类中心。 ```python def init_centroids(X, k): """ 随机初始化k个聚类中心 """ centroids = X.copy() np.random.shuffle(centroids) return centroids[:k] k = 2 centroids = init_centroids(X, k) print("初始聚类中心：") print(centroids) ``` 输出： ``` 初始聚类中心： [[ 3.27057996 -0.43435128] [ 4.61238434 -6.41708773]] ``` 然后，我们可以迭代进行聚类。在每一次迭代中，我们需要将每个数据点分配到最近的聚类中心，并更新聚类中心的位置。 ```python def assign_clusters(X, centroids): """ 将每个数据点分配到最近的聚类中心 """ distances = np.sqrt(((X - centroids[:, np.newaxis])**2).sum(axis=2)) return np.argmin(distances, axis=0) def update_centroids(X, clusters, k): """ 更新聚类中心的位置 """ centroids = np.zeros((k, X.shape[1])) for i in range(k): centroids[i] = X[clusters == i].mean(axis=0) return centroids def k_means(X, k, max_iter=100): """ k-means聚类算法 """ centroids = init_centroids(X, k) for i in range(max_iter): clusters = assign_clusters(X, centroids) new_centroids = update_centroids(X, clusters, k) if np.allclose(new_centroids, centroids): break centroids = new_centroids return centroids, clusters centroids, clusters = k_means(X, k) print("最终聚类中心：") print(centroids) ``` 输出： ``` 最终聚类中心： [[ 4.98515524 -4.99587453] [ 2.94840081 -0.33198444]] ``` 我们可以将聚类结果可视化。 ```python colors = ['r', 'g'] plt.scatter(X[:, 0], X[:, 1], c=[colors[i] for i in clusters]) plt.scatter(centroids[:, 0], centroids[:, 1], marker='x', s=200, linewidths=3, color='b') plt.show() ``` ![image-20211108142358881](https://i.loli.net/2021/11/08/3OoJh6T8yL91w7B.png) 完整代码如下： ```python import numpy as np import matplotlib.pyplot as plt np.random.seed(42) # 生成随机数据 X = np.random.randn(100, 2) X[:50, 0] += 5 X[:50, 1] -= 5 # 绘制数据散点图 plt.scatter(X[:, 0], X[:, 1]) plt.show() def init_centroids(X, k): """ 随机初始化k个聚类中心 """ centroids = X.copy() np.random.shuffle(centroids) return centroids[:k] def assign_clusters(X, centroids): """ 将每个数据点分配到最近的聚类中心 """ distances = np.sqrt(((X - centroids[:, np.newaxis])**2).sum(axis=2)) return np.argmin(distances, axis=0) def update_centroids(X, clusters, k): """ 更新聚类中心的位置 """ centroids = np.zeros((k, X.shape[1])) for i in range(k): centroids[i] = X[clusters == i].mean(axis=0) return centroids def k_means(X, k, max_iter=100): """ k-means聚类算法 """ centroids = init_centroids(X, k) for i in range(max_iter): clusters = assign_clusters(X, centroids) new_centroids = update_centroids(X, clusters, k) if np.allclose(new_centroids, centroids): break centroids = new_centroids return centroids, clusters k = 2 centroids, clusters = k_means(X, k) print("最终聚类中心：") print(centroids) colors = ['r', 'g'] plt.scatter(X[:, 0], X[:, 1], c=[colors[i] for i in clusters]) plt.scatter(centroids[:, 0], centroids[:, 1], marker='x', s=200, linewidths=3, color='b') plt.show() ```

使用python手动实现k-means聚类

相关推荐

python基于K-means聚类算法的图像分割

Python——K-means聚类分析及其结果可视化

Python用K-means聚类算法进行客户分群的实现

手动实现k-means聚类使用夹角余弦

手动实现k-means聚类使用noise_moon数据集

k-means聚类算法python实现

用k-means聚类算法举例实现代码分析的过程

k-means聚类算法 公式

1. 编程实现K-means聚类算法对iris鸢尾花数据集的聚类工作；分析聚类划分k值的选取，以及目标函数的评价准则；

怎么利用python实现k-means分析

[Errno 2] No such file or directory: 'C:/Users/64576/Desktop/新建文件夹（2）/30天聚类/K-means 聚类结果.png

K-MEANS，手动指定聚类中心代码

K-Means算法如果使用

kmeans聚类算法手动python实现

基于K-means具体代码怎么实现

请给出k-means算法的测试代码

Python实现K-means聚类算法.zip

最新推荐

python 代码实现k-means聚类分析的思路(不使用现成聚类库)

智能制造的数字化工厂规划qytp.pptx

罗兰贝格：德隆人力资源管理体系gltp.pptx

JAVA3D的网络三维技术的设计与实现.zip

setuptools-11.3.1.tar.gz

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

解释minorization-maximization (MM) algorithm，并给出matlab代码编写的例子

JSBSim Reference Manual

k-means聚类算法公式