python sklearn.cluster KMeans使用
时间: 2023-10-22 07:05:24 浏览: 100
`sklearn.cluster.KMeans` 是一个用于聚类分析的类,可以用于将数据分成预定数量的簇。以下是使用 `KMeans` 进行聚类分析的一个示例:
```python
from sklearn.cluster import KMeans
import numpy as np
# 生成随机数据
X = np.random.rand(100, 2)
# 定义 KMeans 对象,设定簇的数量为3
kmeans = KMeans(n_clusters=3)
# 训练模型
kmeans.fit(X)
# 查看聚类结果
labels = kmeans.labels_
print(labels)
```
在这个例子中,我们生成了一个包含100个数据点的二维数组 `X`,然后定义了一个 `KMeans` 对象并将簇的数量设定为3。接下来,我们使用 `fit` 方法对模型进行训练,并使用 `labels_` 属性获取聚类结果。
`KMeans` 类的一些常用参数包括:
- `n_clusters`:设定簇的数量。
- `init`:设定初始化簇中心的方法,可以是随机初始化或基于数据的初始化。
- `max_iter`:设定最大迭代次数。
- `n_init`:设定随机初始化的次数,以克服随机初始化的影响。
- `tol`:设定收敛阈值,即聚类中心的变化小于该值时停止迭代。
- `random_state`:设定随机数种子。
`KMeans` 类还提供了一些其他方便的方法,如 `transform` 方法可以将输入数据转换为距离最近的簇中心的距离,`predict` 方法可以预测新数据所属的簇,`fit_transform` 方法可以同时进行训练和转换等。
阅读全文