我需要一个很小的数据集,包含test和train
时间: 2024-03-10 14:50:51 浏览: 14
你可以使用scikit-learn库提供的小型玩具数据集来进行实验和测试,其中有一些数据集包含测试集和训练集,以下是几个常用的玩具数据集:
1. iris数据集:这是一个经典的数据集,包含3个类别的150个样本,每个样本有4个特征。
```python
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)
```
2. digits数据集:这是一个手写数字图像数据集,包含10个类别的1,797个样本,每个样本是8x8像素的灰度图像。
```python
from sklearn.datasets import load_digits
X, y = load_digits(return_X_y=True)
```
3. wine数据集:这是一个酒的质量评分数据集,包含3个类别的178个样本,每个样本有13个特征。
```python
from sklearn.datasets import load_wine
X, y = load_wine(return_X_y=True)
```
以上代码可以将数据集加载到X和y变量中,其中X是特征矩阵,y是目标向量。你可以使用train_test_split函数将数据集分成训练集和测试集:
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
这个代码将数据集分成训练集和测试集,其中测试集大小为20%。你可以根据需要修改测试集大小。