将数据集随机分为训练集和测试集和验证集的代码
时间: 2023-07-28 12:10:34 浏览: 118
给定比例随机划分训练集、验证集和测试集
以下是使用Python的scikit-learn库将数据集随机分为训练集、测试集和验证集的示例代码:
```python
from sklearn.model_selection import train_test_split
# 加载数据集
X, y = load_dataset()
# 将数据集随机分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 将训练集随机分为训练集和验证集
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=42)
# 输出训练集、验证集和测试集的大小
print('Training set size: ', X_train.shape)
print('Validation set size: ', X_val.shape)
print('Test set size: ', X_test.shape)
```
其中,load_dataset()函数用于加载数据集,train_test_split()函数用于将数据集随机分为训练集和测试集,并指定测试集所占比例(test_size参数)。然后,将训练集随机分为训练集和验证集,同样也指定验证集所占比例。最后,输出训练集、验证集和测试集的大小,以确保数据集被正确地分割。
阅读全文