用Python批量提取多个工作簿中同名工作表的特定数据
时间: 2024-04-15 16:29:00 浏览: 16
您好!可以使用Python的pandas库来批量提取多个工作簿中同名工作表的特定数据。以下是一个简单的示例代码:
```python
import pandas as pd
import os
# 定义要提取的特定数据所在的列索引
target_column_index = 2
# 定义存储提取结果的空DataFrame
result_df = pd.DataFrame()
# 遍历工作簿所在的文件夹
folder_path = '工作簿文件夹路径'
for file_name in os.listdir(folder_path):
if file_name.endswith('.xlsx'): # 假设工作簿为Excel文件格式,如有其他格式需修改后缀名
file_path = os.path.join(folder_path, file_name)
# 读取工作簿中的所有工作表
xls = pd.read_excel(file_path, sheet_name=None)
# 遍历工作表
for sheet_name, df in xls.items():
if sheet_name == '目标工作表名称': # 替换为您要提取数据的目标工作表的名称
# 提取特定数据所在的列
target_data = df.iloc[:, target_column_index]
# 将提取的数据存储到结果DataFrame中
result_df[file_name + '_' + sheet_name] = target_data
# 打印结果DataFrame
print(result_df)
```
在代码中,需要您替换`folder_path`为存放工作簿的文件夹路径,以及`目标工作表名称`为您要提取数据的目标工作表的名称。此代码遍历文件夹下的所有Excel文件,读取每个文件的所有工作表,并提取目标工作表中特定列的数据,最后将提取的数据存储到一个结果DataFrame中。