如何使用python实现K-means聚类算法
时间: 2024-10-11 20:05:41 浏览: 34
在Python中实现K-means聚类算法,通常会使用scikit-learn库,这是一个非常流行的机器学习工具包。以下是基本步骤:
1. 导入所需的库:
```python
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
```
2. 准备数据集。假设你已经有了一个二维数组或DataFrame,其中包含样本点:
```python
# 示例数据
data = np.array([[1, 2], [1, 4], [1, 0],
[4, 2], [4, 4], [4, 0],
[7, 2], [7, 4], [7, 0]])
```
3. 初始化KMeans模型,并指定簇的数量(k值):
```python
kmeans = KMeans(n_clusters=3)
```
4. 对数据进行拟合:
```python
kmeans.fit(data)
```
5. 获取聚类结果:
```python
labels = kmeans.labels_
centroids = kmeans.cluster_centers_
```
6. 可视化结果:
```python
plt.scatter(data[:, 0], data[:, 1], c=labels, cmap='viridis')
plt.scatter(centroids[:, 0], centroids[:, 1], marker='x', s=100, linewidths=3, color='red')
plt.show()
```
阅读全文