python训练/测试集划分代码实现
时间: 2023-07-27 14:28:52 浏览: 78
Python 实现训练集、测试集随机划分
下面是一个简单的 Python 代码示例,用于将数据集划分为训练集和测试集:
```python
import random
def split_dataset(dataset, split_ratio):
train_size = int(len(dataset) * split_ratio)
train_set = []
test_set = list(dataset)
while len(train_set) < train_size:
index = random.randrange(len(test_set))
train_set.append(test_set.pop(index))
return train_set, test_set
```
其中,`dataset` 是要划分的数据集,`split_ratio` 是划分比例,通常为 0.7 或 0.8,表示训练集占总数据集的比例。
该函数首先计算出训练集的大小,然后从数据集中随机选择数据点加入训练集,直到训练集的大小达到预设大小。最后,将剩余的数据点作为测试集返回。
使用示例:
```python
dataset = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
train_set, test_set = split_dataset(dataset, 0.7)
print('训练集: ', train_set)
print('测试集: ', test_set)
```
输出:
```
训练集: [1, 7, 8, 5, 10, 9, 3]
测试集: [2, 4, 6]
```
注意,这种随机划分方法可能会导致训练集和测试集的分布不均匀,因此在实际应用中需要进行更加严谨的划分方法。
阅读全文