将批量处理的excel中提取的所有数据整合到一个新的excel表中
时间: 2024-04-12 15:26:39 浏览: 18
要将批量处理的Excel文件中提取的所有数据整合到一个新的Excel表中,您可以使用Python的pandas库。以下是一个示例代码,演示了如何将批量处理的Excel文件中提取的数据整合到一个新的Excel表中:
```python
import pandas as pd
import glob
# 创建一个空的DataFrame,用于存储所有提取的数据
df_combined = pd.DataFrame()
# 获取所有xlsx文件的路径
file_paths = glob.glob('path_to_folder/*.xlsx') # 替换 'path_to_folder' 为包含Excel文件的文件夹路径
for file_path in file_paths:
# 读取Excel文件
df = pd.read_excel(file_path, sheet_name=1) # sheet_name参数指定要读取的工作表索引或名称,索引从0开始
# 提取数据
data = df.iloc[18, 4] # iloc函数用于按行列索引提取数据,索引从0开始
# 将提取的数据添加到合并的DataFrame中
df_combined = df_combined.append({'提取的数据': data}, ignore_index=True)
# 将合并的数据保存到新的Excel文件
df_combined.to_excel('new_excel_file.xlsx', index=False) # index=False 参数表示不保存索引
print("数据整合完成并保存到新的Excel文件")
```
请将代码中的 `'path_to_folder/*.xlsx'` 替换为包含要读取的Excel文件的文件夹路径和文件名模式。代码将遍历所有匹配的Excel文件,读取每个文件中第二个工作表的第19行第E列的数据,并将提取的数据添加到一个合并的DataFrame中。最后,代码将合并的数据保存到名为 `'new_excel_file.xlsx'` 的新Excel文件中。
注意:在使用该代码之前,请确保已经安装了`pandas`库。可以使用以下命令进行安装:`pip install pandas`。