k-mean聚类算法python
时间: 2024-06-23 10:03:16 浏览: 109
K-Means聚类算法是一种常用的无监督机器学习方法,用于将一组数据集划分为预设数量(k)的簇或类别。在Python中,我们通常使用scikit-learn库来实现K-Means。以下是K-Means的基本步骤和Python代码示例:
1. **数据准备**:首先,确保你的数据是数值型的,并且已经准备好进行聚类。
2. **初始化质心**:随机选择k个数据点作为初始簇的质心(centroids)。
3. **迭代过程**:
a. **分配到最近的簇**:对于每个数据点,计算其与所有质心的距离,将其分配到距离最近的簇。
b. **更新质心**:根据当前簇内的所有数据点重新计算新的质心位置。
4. **收敛判断**:如果所有数据点的簇归属没有变化或者达到预定的迭代次数,算法停止;否则返回步骤3。
5. **结果展示**:输出最终的聚类结果和质心。
以下是一个简单的Python代码示例:
```python
from sklearn.cluster import KMeans
import numpy as np
# 假设你有一个二维数组data
data = np.array([[...], [...], ...]) # 需要替换为实际数据
# 设置聚类数
k = 3
# 初始化KMeans模型
kmeans = KMeans(n_clusters=k)
# 训练模型
kmeans.fit(data)
# 获取聚类结果
labels = kmeans.labels_
centroids = kmeans.cluster_centers_
# 输出结果
print("Labels:", labels)
print("Centroids:", centroids)
```
阅读全文