对数据集进行k-mean建模的代码
时间: 2024-05-06 07:15:45 浏览: 61
以下是使用Python的sklearn库进行k-means聚类建模的代码:
```python
# 导入需要的库
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
# 生成数据集
X, y = make_blobs(n_samples=1000, centers=4, random_state=42)
# 建立KMeans模型
kmeans = KMeans(n_clusters=4, random_state=42)
# 训练模型
kmeans.fit(X)
# 打印聚类中心点
print(kmeans.cluster_centers_)
# 可视化聚类结果
plt.scatter(X[:, 0], X[:, 1], c=kmeans.labels_, cmap='viridis')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], marker='*', s=200, color='black')
plt.show()
```
在上述代码中,首先通过使用`make_blobs()`函数生成了一个包含1000个样本的数据集,其中共有4个簇。然后使用`KMeans()`函数建立了一个包含4个簇的KMeans模型,并通过`fit()`函数对其进行了训练。最后,使用`scatter()`函数将聚类结果可视化展示出来,其中不同颜色代表不同的簇,黑色星号表示簇的中心点。
阅读全文