用python写一个读取txt数据文件,并且划分训练数据和预测数据的程序
时间: 2024-05-06 17:15:22 浏览: 59
可以使用Python内置的`open()`函数来读取txt文件,然后使用`train_test_split()`函数来划分数据集。
以下是一个示例程序:
```python
from sklearn.model_selection import train_test_split
# 读取txt文件
with open('data.txt', 'r') as f:
data = f.readlines()
# 去除每行末尾的换行符
data = [line.strip() for line in data]
# 划分数据集,设置预测数据占比为20%
train_data, test_data = train_test_split(data, test_size=0.2)
# 将训练数据和预测数据分别写入文件
with open('train.txt', 'w') as f:
f.write('\n'.join(train_data))
with open('test.txt', 'w') as f:
f.write('\n'.join(test_data))
```
上述程序中,`data.txt`是待读取的txt文件,`train.txt`和`test.txt`是分别保存训练数据和预测数据的文件。
首先使用`open()`函数读取txt文件,然后使用列表推导式去除每行末尾的换行符。
接着使用`train_test_split()`函数划分数据集,将预测数据占比设置为20%。
最后将训练数据和预测数据分别写入文件。可以使用`with`语句来自动管理文件的打开和关闭。`join()`函数用于将列表中的字符串连接成一个字符串,每个字符串之间用换行符分隔。
阅读全文