请帮我写一段 将一个文件夹所有excel表的某一固定列提取出来存放在一个新的excel表的python代码
时间: 2023-06-19 17:03:08 浏览: 100
源码用python将一个Excel表里多个sheet相同的列进行提取并汇总
好的,以下是一个示例代码:
```python
import os
import pandas as pd
# 定义文件夹路径和要提取的列
folder_path = "path/to/folder"
column_name = "column_name"
# 获取文件夹内所有文件的路径
file_paths = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 定义一个空的DataFrame,用于存放提取出来的数据
data = pd.DataFrame()
# 循环遍历每个文件,提取指定列的数据,并添加到data中
for file_path in file_paths:
df = pd.read_excel(file_path)
col_data = df[column_name]
data = data.append(col_data, ignore_index=True)
# 将data保存到新的excel文件中
output_path = "path/to/output.xlsx"
data.to_excel(output_path, index=False)
```
解释一下代码:
1. 首先定义要操作的文件夹路径和要提取的列名。
2. 获取文件夹中所有以.xlsx结尾的文件路径。
3. 定义一个空的DataFrame,用于存放提取出来的数据。
4. 循环遍历每个文件,读取文件中的数据,并将指定列的数据添加到data中。
5. 将data保存到新的excel文件中。
需要注意的是,这个代码只适用于提取单一列的数据,如果要提取多列数据,需要修改代码。同时,如果文件夹中的excel文件格式不统一,可能会导致读取出错。
阅读全文