c均值聚类算法python实现
时间: 2024-07-18 09:00:24 浏览: 85
C均值(K-means Clustering)是一种常用的无监督机器学习算法,用于数据集的分组或聚类。在Python中,你可以使用sklearn库来实现C均值聚类。以下是基本步骤和一个简单的例子:
1. 导入必要的库:
```python
from sklearn.cluster import KMeans
import numpy as np
```
2. 准备数据(假设`data`是一个二维numpy数组,代表样本点的特征向量):
```python
data = np.array([[...], [...], ...]) # 你的数据点在这里
```
3. 初始化聚类中心(通常随机选择,也可以手动指定):
```python
n_clusters = 3 # 假设你想要3个聚类
kmeans = KMeans(n_clusters=n_clusters, init='random') # 使用随机初始化
```
4. 训练模型:
```python
kmeans.fit(data)
```
5. 预测聚类标签:
```python
labels = kmeans.labels_
```
6. 可视化结果(如果数据可视化可行):
```python
import matplotlib.pyplot as plt
plt.scatter(data[:, 0], data[:, 1], c=labels, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], s=300, c='red')
plt.show()
```
阅读全文