生成一段带数据集的K-means代码
时间: 2024-05-08 16:21:12 浏览: 10
好的,以下是一段带数据集的K-means代码,使用Python语言编写:
```python
import numpy as np
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
# 生成随机数据集
X, y = make_blobs(n_samples=100, centers=3, n_features=2, random_state=42)
# 调用KMeans算法进行聚类
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X)
# 输出聚类结果
print("聚类中心点坐标:")
print(kmeans.cluster_centers_)
print("每个样本所属的簇标签:")
print(kmeans.labels_)
# 可视化聚类结果
plt.scatter(X[:, 0], X[:, 1], c=kmeans.labels_, cmap='viridis')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], marker='x', s=200, linewidths=3, color='r')
plt.show()
```
以上代码中,我们先使用`make_blobs`函数生成了一个包含100个样本,3个簇,每个样本包含2个特征的数据集。然后,我们使用`KMeans`算法进行聚类,指定簇的个数为3,最后输出聚类中心点坐标和每个样本所属的簇标签,并将聚类结果可视化展示出来。