python聚类分析kmeans
时间: 2023-11-05 14:00:55 浏览: 95
K-means是一种常用的聚类分析算法,它将数据分成K个不同的聚类,每个聚类都有一个代表性的中心点。在Python中,可以使用scikit-learn库提供的KMeans类来实现K-means算法。
首先,我们需要导入需要的库和数据集。使用以下代码导入库和创建数据集:
```python
from sklearn.cluster import KMeans
import numpy as np
X = np.array([[1,2], [1,4], [1,0], [10,2], [10,4], [10,0]])
```
然后,我们可以建立K-means模型并进行聚类,设定K的值为2。使用以下代码完成此步骤:
```python
kmCluster = KMeans(n_clusters=2).fit(X)
```
接下来,我们可以通过`cluster_centers_`属性获取每个聚类中心的坐标,通过`labels_`属性获取样本集的分类结果。使用以下代码完成此步骤:
```python
print("聚类中心坐标:", kmCluster.cluster_centers_)
print("分类结果:", kmCluster.labels_)
```
最后,我们可以使用`predict()`方法根据模型聚类结果进行预测判断。使用以下代码完成此步骤:
```python
print("显示预测判断:", kmCluster.predict([[0, 0], [12, 3]]))
```
综上所述,K-means算法的基本流程如下:
1. 导入所需的库和数据集。
2. 建立K-means模型并进行聚类,设定K的值。
3. 获取每个聚类中心的坐标和样本集的分类结果。
4. 根据模型聚类结果进行预测判断。