划分训练集和测试集的函数
时间: 2023-09-04 07:08:04 浏览: 100
划分训练集和测试集是机器学习中的一项基本操作,用于评估模型的准确性和泛化能力。以下是一个简单的Python函数,用于将数据集划分为训练集和测试集。
```python
import random
def train_test_split(data, test_ratio):
"""
将数据集data按照比例test_ratio划分为训练集和测试集
:param data: 数据集
:param test_ratio: 测试集比例
:return: 训练集和测试集
"""
# 随机打乱数据
random.shuffle(data)
# 计算测试集的大小
test_size = int(len(data) * test_ratio)
# 划分训练集和测试集
train_data = data[:-test_size]
test_data = data[-test_size:]
return train_data, test_data
```
该函数接受两个参数,数据集和测试集比例。它首先随机打乱数据集,然后根据比例计算测试集的大小,并将数据集划分为训练集和测试集。最后将训练集和测试集作为函数的返回值。
阅读全文