如何使用Python的pandas库合并Excel文件?
时间: 2024-09-17 09:05:40 浏览: 44
使用Python的pandas库合并Excel文件非常直观,pandas支持一次性加载整个Excel文件,或者逐个工作表加载。以下是一个基本步骤:
1. 首先,需要安装`pandas`和`openpyxl`或`xlrd`库,如果还没安装,可以使用`pip install pandas openpyxl` 或 `pip install pandas xlrd`(取决于你的Excel版本)。
2. 导入所需库:
```python
import pandas as pd
```
3. 加载Excel文件:
- 如果你知道确切的工作表名,可以使用`read_excel`函数指定名称:
```python
df1 = pd.read_excel('file1.xlsx', sheet_name='Sheet1')
df2 = pd.read_excel('file2.xlsx', sheet_name='Sheet2')
```
- 如果所有工作表都要合并,可以省略`sheet_name`参数:
```python
df1 = pd.read_excel('file1.xlsx')
df2 = pd.read_excel('file2.xlsx')
```
4. 合并数据:
- 直接拼接列:
```python
merged_df = pd.concat([df1, df2], axis=1) # 水平拼接 (column-wise)
```
- 或者按索引行合并:
```python
merged_df = pd.merge(df1, df2, on='common_column') # 指定共同列进行合并
```
5. 将结果保存为新的Excel文件:
```python
merged_df.to_excel('merged_file.xlsx', index=False) # 将合并后的DataFrame保存到新文件
```
记得检查文件路径和工作表名是否正确,并根据实际情况调整合并策略。
阅读全文