划分训练集验证集测试集的代码
时间: 2023-09-05 07:13:35 浏览: 85
以下是一个简单的划分训练集、验证集和测试集的代码示例,假设我们有一个数据集 `data`,其中包含输入数据和标签。
```python
import numpy as np
# 首先,将数据集按随机顺序打乱
np.random.seed(42)
shuffle_indices = np.random.permutation(np.arange(len(data)))
data = data[shuffle_indices]
# 指定训练集、验证集和测试集的比例
train_ratio = 0.7
val_ratio = 0.15
test_ratio = 0.15
# 划分数据集
num_train = int(train_ratio * len(data))
num_val = int(val_ratio * len(data))
num_test = len(data) - num_train - num_val
train_data = data[:num_train]
val_data = data[num_train:num_train+num_val]
test_data = data[num_train+num_val:]
# 打印数据集大小
print("训练集大小:", len(train_data))
print("验证集大小:", len(val_data))
print("测试集大小:", len(test_data))
```
在这个示例中,我们首先使用 `numpy.random.permutation` 将数据集按随机顺序打乱,然后根据比例划分数据集。最后,我们打印了每个数据集的大小。
阅读全文