python提取多个excel中某一个sheet并汇总
时间: 2023-12-06 17:00:38 浏览: 122
源码用python将一个Excel表里多个sheet相同的列进行提取并汇总
要提取多个Excel文件中的某一个Sheet并汇总,可以使用Python中的pandas库来实现。
首先,需要导入pandas库和os库,以及设置要提取的Sheet名称和Excel文件的路径。
```python
import pandas as pd
import os
sheet_name = "Sheet1" # 要提取的Sheet名称
excel_path = "路径/到/你的/Excel文件夹" # Excel文件夹的路径
```
接下来,可以使用os库的walk函数遍历指定路径下的所有文件,并使用pandas的read_excel函数读取Excel文件的指定Sheet。
```python
dataframe_list = [] # 存储提取的数据的列表
for dirpath, _, filenames in os.walk(excel_path):
for filename in filenames:
if filename.endswith(".xlsx") or filename.endswith(".xls"): # 判断文件是否为Excel文件
file_path = os.path.join(dirpath, filename)
df = pd.read_excel(file_path, sheet_name=sheet_name)
dataframe_list.append(df)
```
最后,使用pandas的concat函数将所有提取的数据进行合并和汇总。
```python
merged_dataframe = pd.concat(dataframe_list)
```
完整的代码如下:
```python
import pandas as pd
import os
sheet_name = "Sheet1" # 要提取的Sheet名称
excel_path = "路径/到/你的/Excel文件夹" # Excel文件夹的路径
dataframe_list = [] # 存储提取的数据的列表
for dirpath, _, filenames in os.walk(excel_path):
for filename in filenames:
if filename.endswith(".xlsx") or filename.endswith(".xls"): # 判断文件是否为Excel文件
file_path = os.path.join(dirpath, filename)
df = pd.read_excel(file_path, sheet_name=sheet_name)
dataframe_list.append(df)
merged_dataframe = pd.concat(dataframe_list)
```
这样,就可以将多个Excel文件中的某一Sheet提取出来并汇总在一个DataFrame中了。
阅读全文