首页将文件划分训练集和测试集

将文件划分训练集和测试集

时间: 2023-09-05 19:09:20 浏览: 94

你可以使用Python中的sklearn库来将文件划分为训练集和测试集。以下是一个示例代码： ```python from sklearn.model_selection import train_test_split # 读取文件 with open('your_data_file.txt', 'r') as file: data = file.readlines() # 划分训练集和测试集 train_data, test_data = train_test_split(data, test_size=0.2, random_state=42) # 将划分后的数据保存到文件 with open('train_data.txt', 'w') as file: file.writelines(train_data) with open('test_data.txt', 'w') as file: file.writelines(test_data) ``` 在这个示例中，假设你的数据文件是'tyour_data_file.txt'。`train_test_split`函数将数据划分为训练集和测试集，其中`test_size`参数指定了测试集的比例（这里是20%），`random_state`参数用于保证每次运行代码得到相同的划分结果。最后，将划分后的数据分别保存到'train_data.txt'和'test_data.txt'文件中。你可以根据自己的需要修改文件名和路径。

阅读全文