kmeans聚类分析 python
时间: 2024-11-28 13:10:20 浏览: 54
K-Means聚类是一种常用的无监督机器学习算法,用于数据集的分组或分类。它的基本思想是将数据分成预设数量(k)的簇,每个簇由离其质心最近的数据点组成。在Python中,我们可以使用sklearn库来进行K-Means聚类分析:
1. **导入库**:首先需要导入`sklearn.cluster.KMeans`模块和其他必要的库,如`numpy`用于处理数组。
```python
from sklearn.cluster import KMeans
import numpy as np
```
2. **准备数据**:确保数据是数值型的,并且已经整理成适合算法的形式,通常是二维数组。
```python
data = np.array(...) # 替换为你的数据
```
3. **创建模型并拟合**:设定所需的簇的数量`n_clusters`,然后实例化KMeans模型并使用`.fit()`方法对数据进行训练。
```python
kmeans = KMeans(n_clusters=3)
kmeans.fit(data)
```
4. **预测类别**:通过`.predict()`方法对新的数据点进行聚类分配。
```python
predictions = kmeans.predict(new_data)
```
5. **评估结果**:查看聚类中心(`cluster_centers_`)、标签(`labels_`)等信息,以及可以使用如轮廓系数Silhouette Coefficient评估聚类的质量。
```python
print(kmeans.cluster_centers_)
print(predictions)
```
阅读全文