python汇总文件夹下的EXCEL表格,提取指定列,以excel表格的名称为行标题保存为新的列表为
时间: 2024-04-16 07:29:00 浏览: 132
您好!要实现您的需求,您可以使用Python中的pandas库来处理Excel文件。下面是一个示例代码,可以帮助您完成这个任务:
```python
import os
import pandas as pd
# 设置文件夹路径
folder_path = '文件夹路径'
output_file = '输出文件路径.xlsx'
# 获取文件夹中的所有Excel文件
excel_files = [file for file in os.listdir(folder_path) if file.endswith('.xlsx')]
# 创建一个空的DataFrame用于存储结果
result_df = pd.DataFrame()
# 遍历每个Excel文件并提取指定列
for file in excel_files:
file_path = os.path.join(folder_path, file)
df = pd.read_excel(file_path)
# 提取指定列,例如提取第一列和第三列
extracted_cols = df.iloc[:, [0, 2]]
# 将提取的数据添加到结果DataFrame中,并以Excel表格的名称为行标题
extracted_cols.columns = [file[:-5] + '_col1', file[:-5] + '_col3']
result_df = pd.concat([result_df, extracted_cols], axis=1)
# 保存结果DataFrame为新的Excel文件
result_df.to_excel(output_file, index=False)
```
请将代码中的`文件夹路径`替换为您实际的文件夹路径,将`输出文件路径.xlsx`替换为您想要保存结果的文件路径。此代码将遍历指定文件夹中的所有Excel文件,并提取每个文件的第一列和第三列数据,然后将结果保存为一个新的Excel文件。
希望这可以帮助到您!如有任何问题,请随时提问。
阅读全文