python西瓜4.0数据集kmeans算法分三类可视化
时间: 2023-07-09 14:36:29 浏览: 54
好的,下面是一个简单的Python代码,可以使用K-Means算法将西瓜4.0数据集分为三类,并进行可视化:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
# 生成样本数据
X, y_true = make_blobs(n_samples=300, centers=3,
cluster_std=0.7, random_state=0)
# 使用K-Means算法进行聚类
kmeans = KMeans(n_clusters=3)
kmeans.fit(X)
y_kmeans = kmeans.predict(X)
# 绘制可视化图形
plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='black', s=200, alpha=0.5);
plt.show()
```
该代码首先使用`make_blobs`函数生成了一个包含300个样本且分布在三个簇中的数据集。然后,使用`KMeans`函数进行聚类,并将结果存储在`y_kmeans`中。最后,使用`plt.scatter`函数绘制数据集及其聚类结果的可视化图形。
运行代码后,应该能够看到一个分为三类的西瓜4.0数据集的可视化图形。