解释k-means聚类算法的代码
时间: 2024-11-28 13:15:49 浏览: 10
K-means是一种常用的无监督机器学习算法,用于将一组数据点分为预设数量的类别(簇)。这里有一个简单的Python实现K-means聚类的基本步骤:
```python
from sklearn.cluster import KMeans
import numpy as np
# 假设我们有如下二维数据集
data = np.array([[1, 2], [1.5, 1.8], [5, 8], [8, 8], [1, 0.6], [9, 11]])
# 定义KMeans模型,设置簇的数量k
kmeans = KMeans(n_clusters=3)
# 拟合数据
kmeans.fit(data)
# 预测每个样本属于哪个簇
labels = kmeans.labels_
# 打印每个簇的中心(质心)
centroids = kmeans.cluster_centers_
print("Centroids:\n", centroids)
print("Labels for each sample:\n", labels)
```
在这个例子中,我们首先导入必要的库,然后创建一个KMeans实例并指定簇的数量。接着,使用`fit()`方法对数据进行拟合,得到每个样本的所属簇标签。最后,`cluster_centers_`属性返回的是每个簇的中心点。
阅读全文