首页python西瓜4.0数据集kmeans算法分三类可视化

python西瓜4.0数据集kmeans算法分三类可视化

时间: 2023-07-09 14:36:29 浏览: 54

好的，下面是一个简单的Python代码，可以使用K-Means算法将西瓜4.0数据集分为三类，并进行可视化： ```python import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn.datasets import make_blobs # 生成样本数据 X, y_true = make_blobs(n_samples=300, centers=3, cluster_std=0.7, random_state=0) # 使用K-Means算法进行聚类 kmeans = KMeans(n_clusters=3) kmeans.fit(X) y_kmeans = kmeans.predict(X) # 绘制可视化图形 plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, cmap='viridis') centers = kmeans.cluster_centers_ plt.scatter(centers[:, 0], centers[:, 1], c='black', s=200, alpha=0.5); plt.show() ``` 该代码首先使用`make_blobs`函数生成了一个包含300个样本且分布在三个簇中的数据集。然后，使用`KMeans`函数进行聚类，并将结果存储在`y_kmeans`中。最后，使用`plt.scatter`函数绘制数据集及其聚类结果的可视化图形。运行代码后，应该能够看到一个分为三类的西瓜4.0数据集的可视化图形。