将多个年报txt文件转换为一个excel文件,并将原文件名也导入对应表格中
时间: 2024-02-12 15:07:23 浏览: 151
好的,我可以帮你实现这个功能。首先,我需要确认一下年报txt文件的格式是否一致,比如每个txt文件中的内容是否都包含相同的列和行。如果格式不同,那么需要对每个文件进行单独处理。
接下来,我们可以使用Python中的pandas库来将多个txt文件转换为一个excel文件,并在表格中添加原文件名。具体的步骤如下:
1. 导入pandas库:
```
import pandas as pd
```
2. 创建一个空的DataFrame对象:
```
df = pd.DataFrame()
```
3. 遍历所有的txt文件,并将它们转换为DataFrame对象,然后将这些对象添加到df中:
```
import os
txt_path = 'path/to/txt/files'
for file_name in os.listdir(txt_path):
if file_name.endswith('.txt'):
file_path = os.path.join(txt_path, file_name)
# 读取txt文件并转换为DataFrame对象
temp_df = pd.read_csv(file_path, delimiter='\t', header=None)
# 添加文件名列
temp_df['文件名'] = file_name
# 将temp_df添加到df中
df = pd.concat([df, temp_df], ignore_index=True)
```
在这个例子中,我们假设txt文件使用tab分隔符,并且没有列名。如果txt文件的格式不同,需要根据实际情况进行修改。
4. 将df写入excel文件:
```
excel_path = 'path/to/excel/file.xlsx'
with pd.ExcelWriter(excel_path) as writer:
df.to_excel(writer, index=False)
```
在这个例子中,我们假设输出到一个名为file.xlsx的excel文件中。
这样,我们就完成了将多个txt文件转换为一个excel文件,并在表格中添加原文件名的操作。
阅读全文