sklearn鸢尾花聚类
时间: 2023-11-29 16:02:11 浏览: 42
sklearn是一个常用的机器学习库,提供了许多强大的聚类算法。其中,鸢尾花数据集是一个经典的数据集,常用于学习聚类算法。
首先,我们需要导入sklearn库中的相关模块和数据集:
from sklearn.datasets import load_iris
from sklearn.cluster import KMeans
然后,我们加载鸢尾花数据集:
data = load_iris().data
接下来,我们选择合适的聚类算法及其参数。这里我们选择K均值聚类算法,并设置聚类数目为3:
kmeans = KMeans(n_clusters=3)
然后,我们使用K均值算法对鸢尾花数据集进行聚类:
kmeans.fit(data)
聚类完成后,我们可以获取每个样本所属的类别标签:
labels = kmeans.labels_
最后,我们可以将聚类结果进行可视化展示:
import matplotlib.pyplot as plt
plt.scatter(data[:, 0], data[:, 1], c=labels)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.title('Iris Clustering')
plt.show()
通过上述步骤,我们使用sklearn库中的K均值算法对鸢尾花数据集进行了聚类,并将聚类结果可视化展示出来。这样,我们可以更好地理解鸢尾花数据集的内在结构,并根据聚类结果进行更深入的分析和研究。