鸢尾花数据集可视化knn
时间: 2023-07-21 09:09:20 浏览: 84
对于鸢尾花数据集的可视化,我们可以使用KNN算法来进行分类,并将不同类别的数据点在二维平面上进行展示。下面是使用Python和Scikit-learn库来实现的示例代码:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data[:, :2] # 只取前两个特征
y = iris.target
# 定义KNN分类器
knn = KNeighborsClassifier(n_neighbors=5)
# 拟合数据
knn.fit(X, y)
# 生成网格点坐标
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
h = 0.02 # 步长
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
# 预测网格点的分类结果
Z = knn.predict(np.c_[xx.ravel(), yy.ravel()])
# 将分类结果可视化
Z = Z.reshape(xx.shape)
plt.figure(figsize=(8, 6))
plt.contourf(xx, yy, Z, alpha=0.8)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Set1)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.title('KNN Classifier')
plt.show()
```
这段代码会生成一个二维平面上的分类图,不同类别的数据点用不同颜色表示。你可以根据需要调整KNN算法的参数,如邻居数目(`n_neighbors`)来观察不同的分类效果。
阅读全文