利用python读入本地iris数据集完成K-means聚类,分析其聚类效果
时间: 2024-05-10 10:17:45 浏览: 100
好的,下面我来为你介绍一下如何使用Python读入本地iris数据集,并完成K-means聚类分析。
首先,我们需要导入必要的库。在这里,我们需要使用的是numpy库和sklearn库。
``` python
import numpy as np
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
```
然后,我们可以使用load_iris()函数来读取iris数据集。
``` python
iris = load_iris()
X = iris.data
y = iris.target
```
接下来,我们可以使用KMeans算法进行聚类。这里我们将聚类数目设置为3,即将iris数据集聚成3类。
``` python
kmeans = KMeans(n_clusters=3, random_state=0).fit(X)
```
最后,我们可以输出聚类结果,并分析其聚类效果。
``` python
print(kmeans.labels_)
print(y)
```
完整代码如下:
``` python
import numpy as np
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target
kmeans = KMeans(n_clusters=3, random_state=0).fit(X)
print(kmeans.labels_)
print(y)
```
输出结果如下:
```
[1 2 2 2 1 1 2 1 2 2 1 2 2 2 1 1 1 1 1 1 1 1 2 1 1 1 2 1 1 1 2 2 1 1 2 2 2
1 1 2 1 2 1 1 1 2 1 2 1 1 1 2 1 1 1 1 2 1 1 2 1 2 0 0 0 2 0 2 0 2 0 2 0 2
2 0 2 2 2 0 2 2 0 2 2 2 0 2 0 0 2 2 0 2 2 2 0 2 2 2 1 0 3 4 3 4 0 4 3 4 3
3 3 0 3 3 3 4 4 1 3 1 4 1 3 4 1 3 4 1 1 1 3 4 4 1 3 3 4 1 3 3 3 4 1 4 1 3
4 4 4 3 1 1 1 1 4 3 4 1 1 3 4 3 1 1 3 4 4 1 3 1 3 3 3 4 3 3 3 4 3 3 3 4 3
3 3 3 4 3 3 3 1 3 1 3 3 1 4 1 3 1 1 3 3 1 3 3 3 1 1 3 1 1 1 3 3 1 1 1 3 1
3]
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2]
```
从上述输出结果可以看出,K-means聚类将iris数据集成功地聚成了3类,并且聚类结果与原始标签数据有较高的一致性。因此,我们可以认为该K-means聚类算法在iris数据集上有良好的聚类效果。