使用pandas库将一个 Excel 文件中的数十个工作表合并到一个工作表中
时间: 2024-10-22 09:11:14 浏览: 13
在Python中,你可以使用Pandas库中的`read_excel`函数读取Excel文件,然后利用`concat`函数将多个工作表合并到一起。以下是一个简单的步骤:
1. 首先,安装所需的库,如果还没有安装,可以使用pip进行安装:
```bash
pip install pandas openpyxl
```
2. 导入pandas库:
```python
import pandas as pd
```
3. 定义你要合并的工作表名称列表,假设它们都在同一Excel文件中:
```python
workbook_name = 'your_file.xlsx'
sheet_names = ['Sheet1', 'Sheet2', 'Sheet3'] # 替换为你的实际工作表名
```
4. 使用`pd.read_excel`函数按需读取每个工作表,并存储在DataFrame对象的字典中:
```python
data_frames = {}
for sheet in sheet_names:
data_frames[sheet] = pd.read_excel(workbook_name, sheet_name=sheet)
```
5. 最后,使用`pd.concat`函数沿着指定轴(通常是列,axis=1),合并所有数据框:
```python
merged_df = pd.concat(data_frames, ignore_index=True) # ignore_index=True用于重置索引
```
这将把所有工作表的内容拼接成一个新的大型DataFrame,其中每一行都是从各个源表复制过来的。
阅读全文