如何在新版 Scikit-learn 中加载其他经典机器学习数据集?
时间: 2024-11-12 17:37:14 浏览: 56
在新版的 Scikit-learn 中(例如 0.24 版本及以上),你可以通过以下步骤加载常用的经典机器学习数据集:
1. **波士顿房价数据** (previously `load_boston`): 使用 `sklearn.datasets.load_boston()` 替代,现在可能需要从 `datasets` 模块导入。例如:
```python
from sklearn.datasets import load_boston
boston = load_boston()
```
2. **鸢尾花数据集** (`load_iris`): 直接导入并加载:
```python
from sklearn.datasets import load_iris
iris = load_iris()
```
3. ** digits 数据集** (`load_digits`): 类似地加载:
```python
from sklearn.datasets import load_digits
digits = load_digits()
```
4. **手写数字识别数据(Fashion-MNIST)**: 如果你想用 MNIST 级别的数据,可以使用 `sklearn.datasets.fetch_openml` 获取 Fashion-MNIST,或者 `tensorflow.keras.datasets` 获取 TensorFlow 预加载的数据集。
每个数据集返回的对象通常包含训练数据、测试数据以及相关的元数据信息,如特征名称等。记得查看文档以获取最新的功能和用法说明。
阅读全文