python自带knn数据集
时间: 2023-07-09 18:21:58 浏览: 87
python 实现knn算法
Python 自带的 KNN 数据集是鸢尾花数据集(Iris Dataset),这是一个非常经典的分类问题数据集,由英国统计学家 Fisher 在 1936 年收集整理。
这个数据集包含了 3 类各 50 个样本,每个样本包含了 4 个特征,分别是花萼长度、花萼宽度、花瓣长度、花瓣宽度。这 3 类花分别是 Setosa、Versicolour 和 Virginica,它们的特征如下:
| 类别 | 花萼长度 | 花萼宽度 | 花瓣长度 | 花瓣宽度 |
| --- | --- | --- | --- | --- |
| Setosa | 5.1 cm ± 0.2 cm | 3.5 cm ± 0.3 cm | 1.4 cm ± 0.2 cm | 0.2 cm ± 0.1 cm |
| Versicolour | 5.9 cm ± 0.3 cm | 2.8 cm ± 0.3 cm | 4.5 cm ± 0.5 cm | 1.5 cm ± 0.2 cm |
| Virginica | 6.5 cm ± 0.3 cm | 3.0 cm ± 0.3 cm | 5.6 cm ± 0.6 cm | 2.0 cm ± 0.3 cm |
可以使用 Scikit-learn 库来加载鸢尾花数据集,示例代码如下:
```python
from sklearn.datasets import load_iris
iris = load_iris() # 加载鸢尾花数据集
X = iris.data # 获取数据集特征
y = iris.target # 获取数据集标签
```
通过上述代码可以获取到鸢尾花数据集的特征和标签,可以用来进行 KNN 分类等算法的实现。
阅读全文