请帮我写一段 将一个文件夹所有excel表的某一固定列提取出来存放在一个新的excel表,行索引为原来excel表名称的python代码
时间: 2023-06-16 19:08:05 浏览: 155
可以使用 Python 的 pandas 库来完成这个任务。代码如下:
```python
import os
import pandas as pd
# 定义文件夹路径
folder_path = '/your/folder/path/'
# 定义提取的列名
column_name = 'your_column_name'
# 定义保存结果的文件名和路径
result_path = '/your/result/path/result.xlsx'
# 初始化结果 DataFrame 和文件名列表
result_df = pd.DataFrame()
file_names = []
# 遍历文件夹中的所有文件
for file_name in os.listdir(folder_path):
# 判断是否为 Excel 文件
if file_name.endswith('.xlsx'):
# 读取 Excel 文件
file_path = os.path.join(folder_path, file_name)
df = pd.read_excel(file_path)
# 提取指定的列
column = df[column_name]
# 将列添加到结果 DataFrame 中
result_df[file_name] = column
# 添加文件名到文件名列表中
file_names.append(file_name)
# 将结果保存为 Excel 文件
result_df.index = column.index
result_df.columns = file_names
result_df.to_excel(result_path)
```
解释一下代码:
1. 首先定义文件夹路径、要提取的列名、保存结果的文件名和路径。
2. 然后初始化结果 DataFrame 和文件名列表。
3. 接着遍历文件夹中的所有文件,判断是否为 Excel 文件,如果是则读取 Excel 文件并提取指定的列,将列添加到结果 DataFrame 中,同时将文件名添加到文件名列表中。
4. 最后将结果 DataFrame 保存为 Excel 文件,行索引为原来 Excel 表的行索引,列索引为原来 Excel 表的文件名。
阅读全文