1.使用k-means聚类实现 sklearn提供的鸢尾花数据集聚类,并可视化。(代码需要包含注释)
时间: 2024-06-14 19:07:20 浏览: 110
以下是使用sklearn提供的鸢尾花数据集进行k-means聚类并可视化的代码:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
# 创建KMeans模型并进行聚类
kmeans = KMeans(n_clusters=3, random_state=0)
kmeans.fit(X)
# 获取聚类结果和聚类中心
labels = kmeans.labels_
centers = kmeans.cluster_centers_
# 可视化聚类结果
plt.scatter(X[:, 0], X[:, 1], c=labels)
plt.scatter(centers[:, 0], centers[:, 1], marker='x', color='red')
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.title('K-means Clustering of Iris Dataset')
plt.show()
```
这段代码首先导入了所需的库,包括numpy、matplotlib、sklearn.cluster中的KMeans和sklearn.datasets中的load_iris。然后,加载了鸢尾花数据集,并将其存储在变量X中。接下来,创建了一个KMeans模型,并指定了聚类的数量为3。然后,使用fit()方法对数据进行聚类。获取聚类结果和聚类中心后,使用scatter()函数将数据点和聚类中心可视化。最后,添加了横轴和纵轴的标签,以及标题,并使用show()函数显示图形。
阅读全文