读取存贷款数据.xlsx内的每张Sheet表,每张表从第3行开始,不包括最后一行,新增一列数据,数据内容为对应Sheet表名,合并数据,保存到新文档
时间: 2024-04-05 07:35:23 浏览: 62
好的,我明白了。为了实现你的要求,我们需要使用Python中的pandas库,首先需要安装pandas库,你可以在终端或命令行中输入以下命令进行安装:
```python
pip install pandas
```
安装完成后,我们可以使用以下代码来实现你的需求:
```python
import pandas as pd
# 读取原始数据文件
data = pd.read_excel('存贷款数据.xlsx', sheet_name=None, header=2)
# 新建一个空的DataFrame用于保存处理后的数据
new_data = pd.DataFrame()
# 遍历每个Sheet表
for name, sheet in data.items():
# 新增一列数据,数据内容为Sheet表名
sheet['表名'] = name
# 将Sheet表从第3行开始,不包括最后一行的数据合并到新的DataFrame中
new_data = pd.concat([new_data, sheet.iloc[2:-1]])
# 保存处理后的数据到新文件
new_data.to_excel('处理后的数据.xlsx', index=False)
```
代码说明:
- 第1行导入pandas库
- 第4行使用read_excel函数读取Excel文件,sheet_name参数设置为None表示读取所有Sheet表,header参数设置为2表示从第3行开始读取数据
- 第7行新建一个空的DataFrame用于保存处理后的数据
- 第10-14行使用for循环遍历每个Sheet表,其中name为Sheet表名,sheet为对应的DataFrame数据
- 第11行新增一列数据,数据内容为Sheet表名
- 第12行将Sheet表从第3行开始,不包括最后一行的数据合并到新的DataFrame中
- 第16行使用to_excel函数将处理后的数据保存到新文件,index参数设置为False表示不保存行索引
你可以将以上代码保存到一个Python文件中,比如说`process_data.py`,然后在命令行中运行以下命令即可执行代码:
```python
python process_data.py
```
代码执行完成后,处理后的数据会保存在名为`处理后的数据.xlsx`的Excel文件中。
阅读全文