import pandas as pd # 指定要拼接的表格文件名列表 filenames = [ '附件一:2022年12月末存量公司客户管户认领情况表__海沧-1.xlsx', '附件三:2022年12月末存量机构客户管户认领情况表__海沧支行-1.xlsx', '附件二:2023年3月末新拓公司客户管户认领情况表__海沧-1.xlsx', '附件四:2023年3月末新拓机构客户管户认领情况表__海沧支行-1.xlsx' ] # 使用 Pandas 库的 read_excel() 函数读取每个表格的数据,并将标题行单独读取出来 dataframes = [] headers = [] for filename in filenames: df = pd.read_excel(filename) header = df.iloc[0] # 假设标题行在第一行 headers.append(header) dataframes.append(df[1:]) # 去掉标题行后的数据 # 使用 Pandas 库的 concat() 函数将数据框拼接在一起 result = pd.concat(dataframes, axis=0, ignore_index=True) # 将标题行合并为一个数据框,并使用 fillna() 函数将空值填充为前一个非空值 header = pd.concat(headers, axis=1, ignore_index=True) header = header.fillna(method='ffill') # 将标题行作为新数据框的列名 result.columns = header.iloc[0] # 将拼接后的结果保存到新的 Excel 文件中 result.to_excel('output.xlsx', index=False)
时间: 2024-01-25 08:05:13 浏览: 96
python数据分析与可视化 import pandas as pd import numpy as np import m
这段代码的作用是将指定的 Excel 表格文件按顺序读取并拼接在一起,去掉重复的标题行,并将拼接后的结果保存到新的 Excel 文件中。其中,使用了 Pandas 库中的 read_excel() 函数来读取指定的 Excel 表格数据,并使用 concat() 函数将多个数据框拼接在一起。还使用了 fillna() 函数将空值填充为前一个非空值,以及将拼接后的结果保存到新的 Excel 文件中。
阅读全文