请帮我写一段 将一个文件夹所有excel表的某一固定列提取出来存放在一个新的excel表,行索引为原来excel表名称的python代码
时间: 2023-06-16 08:07:29 浏览: 185
可以使用Python中的pandas库来实现这个功能,以下是示例代码:
```python
import pandas as pd
import os
# 定义要提取的列的名称
col_name = 'column_name'
# 定义文件夹路径
folder_path = 'path/to/folder'
# 创建一个空的DataFrame来存放提取出的数据
df_all = pd.DataFrame()
# 遍历文件夹内的所有文件
for file_name in os.listdir(folder_path):
if file_name.endswith('.xlsx'):
# 读取Excel文件
df = pd.read_excel(os.path.join(folder_path, file_name))
# 提取指定列的数据
col_data = df[col_name]
# 将数据添加到新的DataFrame中,并添加一列文件名作为索引
df_all[file_name] = col_data
# 将新的DataFrame保存为Excel文件
df_all.to_excel('output_file.xlsx', index_label='file_name')
```
以上代码会读取文件夹中所有以`.xlsx`结尾的Excel文件,提取指定的列(`column_name`),并将它们添加到新的DataFrame中,然后将这个新的DataFrame保存为一个新的Excel文件(`output_file.xlsx`),其中行索引为原来Excel表的名称(作为新DataFrame的列名)。
阅读全文