用python写一段提取大量txt中的数据 后将我所需要的数据都存入表格中
时间: 2024-03-01 21:55:27 浏览: 93
基于Python快速处理PDF表格数据
好的,我可以帮你完成这个任务。首先,我们需要安装Python中的pandas和numpy模块,用于处理数据和创建表格。
安装方法:
```python
pip install pandas
pip install numpy
```
接下来,我们需要编写一个程序来读取所有的txt文件,并从中提取需要的数据。这里我假设每个txt文件中都有一行数据,格式为“编号,名称,数量,价格”,我们需要从中提取名称和价格两列数据。
代码如下:
```python
import os
import pandas as pd
import numpy as np
# 定义数据存储列表
data_list = []
# 定义需要读取的txt文件夹路径
dir_path = '/path/to/txt/folder'
# 循环读取txt文件
for file_name in os.listdir(dir_path):
if file_name.endswith('.txt'):
file_path = os.path.join(dir_path, file_name)
with open(file_path, 'r', encoding='utf-8') as f:
line = f.readline().strip()
# 按逗号分割数据,取出需要的名称和价格列
data = line.split(',')
name = data[1]
price = data[3]
# 将数据存入列表中
data_list.append([name, price])
# 将数据转换为DataFrame格式
df = pd.DataFrame(data_list, columns=['name', 'price'])
# 将数据存入表格
df.to_csv('/path/to/output.csv', index=False, encoding='utf-8')
```
以上代码会将读取到的所有txt文件中的名称和价格数据提取出来,存储到一个数据列表中。然后将数据列表转换为DataFrame格式,并将数据保存到一个csv文件中,文件名为output.csv,存储路径为/path/to/。
阅读全文