使用K-means算法对鸢尾花数据集进行聚类
时间: 2023-06-10 15:09:19 浏览: 163
基于k-means算法实现二维坐标和鸢尾花数据集的分类
好的,下面是使用K-means算法对鸢尾花数据集进行聚类的步骤:
1. 导入需要的库和数据集
```python
import pandas as pd
import numpy as np
from sklearn import datasets
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
iris = datasets.load_iris()
X = iris.data[:, :2] # 取前两个特征,方便可视化
y = iris.target
```
2. 可视化数据集
```python
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.show()
```
上图是鸢尾花数据集的散点图,横轴是花萼长度,纵轴是花萼宽度,不同颜色代表不同种类的花。
3. 使用K-means算法进行聚类
```python
kmeans = KMeans(n_clusters=3, random_state=0).fit(X)
```
这里选择将数据集分为3类,随机种子为0。
4. 可视化聚类结果
```python
y_pred = kmeans.predict(X)
plt.scatter(X[:, 0], X[:, 1], c=y_pred)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.show()
```
上图是K-means算法聚类的结果,不同颜色代表不同的聚类簇。
完整代码如下:
阅读全文