读取存贷款数据.xlsx内的每张Sheet表,每张表新增一列,列名为“所属网点”,然后从第三行到倒数最后一行,引用对应表的表名,保存文档
时间: 2024-04-05 12:35:07 浏览: 101
好的,根据你的要求,我们需要对上一个问题的代码做一些修改。具体来说,我们需要对每张表新增一列,列名为“所属网点”,然后从第三行到倒数最后一行,引用对应表的表名。以下是实现你的需求的代码:
```python
import pandas as pd
# 读取原始数据文件
data = pd.read_excel('存贷款数据.xlsx', sheet_name=None, header=None)
# 新建一个空的DataFrame用于保存处理后的数据
new_data = pd.DataFrame()
# 遍历每个Sheet表
for name, sheet in data.items():
# 新增一列数据,数据内容为Sheet表名
sheet['所属网点'] = name
# 从第三行到倒数第二行引用对应表的表名
sheet.iloc[2:-1, -1] = name
# 将处理后的数据合并到新的DataFrame中
new_data = pd.concat([new_data, sheet])
# 保存处理后的数据到新文件
new_data.to_excel('处理后的数据.xlsx', index=False)
```
代码说明:
- 第1行导入pandas库
- 第4行使用read_excel函数读取Excel文件,sheet_name参数设置为None表示读取所有Sheet表,header参数设置为None表示不读取表头
- 第7行新建一个空的DataFrame用于保存处理后的数据
- 第10-16行使用for循环遍历每个Sheet表,其中name为Sheet表名,sheet为对应的DataFrame数据
- 第12-13行新增一列数据,列名为“所属网点”,数据内容为Sheet表名
- 第15行从第三行到倒数第二行引用对应表的表名,即将“所属网点”列的第3行到倒数第二行的值设置为Sheet表名
- 第18行将处理后的数据合并到新的DataFrame中
- 第21行使用to_excel函数将处理后的数据保存到新文件,index参数设置为False表示不保存行索引
你可以将以上代码保存到一个Python文件中,比如说`process_data.py`,然后在命令行中运行以下命令即可执行代码:
```python
python process_data.py
```
代码执行完成后,处理后的数据会保存在名为`处理后的数据.xlsx`的Excel文件中。
阅读全文