分裂聚类对鸢尾花数据集聚类
时间: 2023-08-10 19:03:50 浏览: 105
k均值、合并聚类和DBSCAN聚类算法对鸢尾花数据集聚类代码.zip
5星 · 资源好评率100%
鸢尾花数据集是一个经典的聚类数据集,通常用于测试聚类算法。这个数据集包含150个样本,分为三个不同的品种:山鸢尾、变色鸢尾和维吉尼亚鸢尾,每个样本有四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。
使用Python的sklearn库中的分裂聚类算法可以对鸢尾花数据集进行聚类,具体的代码如下:
```python
from sklearn.datasets import load_iris
from sklearn.cluster import AgglomerativeClustering
iris = load_iris()
X = iris.data
model = AgglomerativeClustering(n_clusters=3, linkage='ward')
model.fit(X)
labels = model.labels_
print(labels)
```
在这个代码中,我们首先加载鸢尾花数据集,并将数据存储在X变量中。然后,我们定义了一个AgglomerativeClustering对象,其中n_clusters参数指定了希望聚类的数量,linkage参数指定了使用的链接方法(ward表示使用Ward方差最小化算法)。最后,我们使用fit()方法拟合模型,并使用labels_属性获取每个样本的聚类分配结果。
这段代码的输出将是一个长度为150的数组,其中每个元素表示对应样本所属的聚类编号。
阅读全文