划分数据集python代码
时间: 2023-04-06 13:03:30 浏览: 123
以下是划分数据集的 Python 代码示例:
```python
import random
# 假设有一个包含 1000 个样本的数据集
data = list(range(1000))
# 随机打乱数据集
random.shuffle(data)
# 划分训练集、验证集和测试集
train_ratio = 0.8 # 训练集占比
val_ratio = 0.1 # 验证集占比
test_ratio = 0.1 # 测试集占比
train_size = int(len(data) * train_ratio)
val_size = int(len(data) * val_ratio)
test_size = len(data) - train_size - val_size
train_data = data[:train_size]
val_data = data[train_size:train_size+val_size]
test_data = data[train_size+val_size:]
print(f"训练集大小:{len(train_data)}")
print(f"验证集大小:{len(val_data)}")
print(f"测试集大小:{len(test_data)}")
```
这段代码将数据集随机打乱后,按照给定的比例划分为训练集、验证集和测试集。其中,训练集占 80%、验证集占 10%、测试集占 10%。
阅读全文