将文件划分训练集和测试集
时间: 2023-09-05 19:09:20 浏览: 94
你可以使用Python中的sklearn库来将文件划分为训练集和测试集。以下是一个示例代码:
```python
from sklearn.model_selection import train_test_split
# 读取文件
with open('your_data_file.txt', 'r') as file:
data = file.readlines()
# 划分训练集和测试集
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)
# 将划分后的数据保存到文件
with open('train_data.txt', 'w') as file:
file.writelines(train_data)
with open('test_data.txt', 'w') as file:
file.writelines(test_data)
```
在这个示例中,假设你的数据文件是'tyour_data_file.txt'。`train_test_split`函数将数据划分为训练集和测试集,其中`test_size`参数指定了测试集的比例(这里是20%),`random_state`参数用于保证每次运行代码得到相同的划分结果。最后,将划分后的数据分别保存到'train_data.txt'和'test_data.txt'文件中。你可以根据自己的需要修改文件名和路径。
阅读全文