用代码实现将数据集分为训练集和测试集
时间: 2023-07-16 21:16:12 浏览: 81
目标检测数据集:路面缺陷检测数据(VOC标注格式的xml文件,已经做了训练集和测试集划分)
5星 · 资源好评率100%
假设你有一个名为 `data` 的数据集,可以使用以下代码将其分为训练集和测试集:
```python
from sklearn.model_selection import train_test_split
# 分割数据集,test_size=0.2 表示将 20% 的数据划分为测试集
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)
```
在这里,我们使用了 `train_test_split` 函数来将数据集分为训练集和测试集。 `test_size` 参数指定了测试集占总数据集的比例。 `random_state` 参数用于指定随机数生成器的种子,以便每次运行代码时都得到相同的结果。 `train_data` 和 `test_data` 变量将包含分割后的训练集和测试集。
阅读全文