pandas读取xlsx文件 合并两张xlsx表
时间: 2024-10-11 16:12:53 浏览: 36
Pandas是一个强大的数据分析库,在Python中非常流行,用于数据清洗、处理和分析。如果你想用pandas来合并两个Excel(.xlsx)文件,可以按照以下步骤操作:
1. 首先,你需要安装`openpyxl`库,它专门用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件格式,可以使用命令行安装:
```
pip install openpyxl
```
2. 然后,你可以使用`pandas.read_excel()`函数来读取.xlsx文件,例如:
```python
import pandas as pd
# 假设文件名为file1.xlsx和file2.xlsx
df1 = pd.read_excel('file1.xlsx')
df2 = pd.read_excel('file2.xlsx')
```
这里df1和df2就是分别加载两个Excel表格的数据。
3. 接下来,可以使用`pd.concat()`函数将两个DataFrame水平(默认)或垂直地合并在一起。如果你想要沿某一列进行合并,可以指定`axis=1`:
```python
merged_df = pd.concat([df1, df2], ignore_index=True) # 如果索引不需要保留,可以设置ignore_index=True
# 或者指定列名
merged_df = pd.merge(df1, df2, on='共享列名', how='outer') # 如果需要按特定列合并
```
4. 最后,记得检查合并后的数据是否有缺失值或错误,以及是否满足预期的结构。
阅读全文