使用sklearn.cluster.KMeans对鸢尾花数据进行聚类
时间: 2024-05-07 15:21:35 浏览: 98
好的,让我们来进行鸢尾花数据的聚类。首先,我们需要导入需要的库和数据集:
```python
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target
```
接下来,我们需要选择聚类的数量。在这里,我们选择3个聚类中心。然后,我们使用KMeans模型进行训练和预测:
```python
kmeans = KMeans(n_clusters=3, random_state=42)
y_pred = kmeans.fit_predict(X)
```
最后,我们可以将聚类结果可视化:
```python
import matplotlib.pyplot as plt
plt.scatter(X[:, 0], X[:, 1], c=y_pred)
plt.title("KMeans Clustering")
plt.show()
```
这里只使用了数据的前两个特征来可视化聚类结果,但是可以根据需要选择不同的特征进行可视化。完整代码如下:
```python
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
iris = load_iris()
X = iris.data
y = iris.target
kmeans = KMeans(n_clusters=3, random_state=42)
y_pred = kmeans.fit_predict(X)
plt.scatter(X[:, 0], X[:, 1], c=y_pred)
plt.title("KMeans Clustering")
plt.show()
```
阅读全文