首页将数据集随机分为训练集和测试集和验证集的代码

将数据集随机分为训练集和测试集和验证集的代码

时间: 2023-07-28 09:10:34 浏览: 122

以下是使用Python的scikit-learn库将数据集随机分为训练集、测试集和验证集的示例代码： ```python from sklearn.model_selection import train_test_split # 加载数据集 X, y = load_dataset() # 将数据集随机分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 将训练集随机分为训练集和验证集 X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=42) # 输出训练集、验证集和测试集的大小 print('Training set size: ', X_train.shape) print('Validation set size: ', X_val.shape) print('Test set size: ', X_test.shape) ``` 其中，load_dataset()函数用于加载数据集，train_test_split()函数用于将数据集随机分为训练集和测试集，并指定测试集所占比例（test_size参数）。然后，将训练集随机分为训练集和验证集，同样也指定验证集所占比例。最后，输出训练集、验证集和测试集的大小，以确保数据集被正确地分割。

阅读全文