首页k-mean聚类算法python

k-mean聚类算法python

时间: 2024-06-23 10:03:16 浏览: 109

K-Means聚类算法是一种常用的无监督机器学习方法，用于将一组数据集划分为预设数量（k）的簇或类别。在Python中，我们通常使用scikit-learn库来实现K-Means。以下是K-Means的基本步骤和Python代码示例： 1. **数据准备**：首先，确保你的数据是数值型的，并且已经准备好进行聚类。 2. **初始化质心**：随机选择k个数据点作为初始簇的质心（centroids）。 3. **迭代过程**： a. **分配到最近的簇**：对于每个数据点，计算其与所有质心的距离，将其分配到距离最近的簇。 b. **更新质心**：根据当前簇内的所有数据点重新计算新的质心位置。 4. **收敛判断**：如果所有数据点的簇归属没有变化或者达到预定的迭代次数，算法停止；否则返回步骤3。 5. **结果展示**：输出最终的聚类结果和质心。以下是一个简单的Python代码示例： ```python from sklearn.cluster import KMeans import numpy as np # 假设你有一个二维数组data data = np.array([[...], [...], ...]) # 需要替换为实际数据 # 设置聚类数 k = 3 # 初始化KMeans模型 kmeans = KMeans(n_clusters=k) # 训练模型 kmeans.fit(data) # 获取聚类结果 labels = kmeans.labels_ centroids = kmeans.cluster_centers_ # 输出结果 print("Labels:", labels) print("Centroids:", centroids) ```

阅读全文