train_test_split 训练集测试集验证集
时间: 2023-10-24 22:06:35 浏览: 129
划分数据集为测试集、验证集、训练集
train_test_split是机器学习中常用的函数,用于将数据集划分为训练集、测试集和验证集。通常情况下,我们会将数据集划分为训练集和测试集,用于模型的训练和评估。而验证集一般用于调参和选择模型。
train_test_split函数的常用参数有:
- test_size: 测试集的大小,可以是一个小数表示比例,也可以是整数表示样本数量。
- train_size: 训练集的大小,同样可以是一个小数或整数。
- random_state: 随机种子,用于控制数据集的随机划分。
train_test_split函数的返回结果是一个元组,包含划分好的训练集和测试集(以及验证集)。通常的用法是将返回结果分别赋给训练集和测试集的变量。
示例代码如下所示:
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
阅读全文