python怎么对多个表进行合并
时间: 2023-12-17 16:04:32 浏览: 108
python合并多个excel表格
在Python中,可以使用pandas库中的merge()函数对多个表进行合并。merge()函数可以根据指定的列将多个表进行合并,并根据指定的合并方式进行操作。
例如,有两个表df1和df2,它们的结构如下:
```python
import pandas as pd
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})
```
df1表的结构如下:
| key | value |
| --- | --- |
| A | 1 |
| B | 2 |
| C | 3 |
| D | 4 |
df2表的结构如下:
| key | value |
| --- | --- |
| B | 5 |
| D | 6 |
| E | 7 |
| F | 8 |
可以使用merge()函数将两个表按照key列进行内连接合并:
```python
df_merge = pd.merge(df1, df2, on='key', how='inner')
```
合并后的结果如下:
| key | value_x | value_y |
| --- | --- | --- |
| B | 2 | 5 |
| D | 4 | 6 |
其中,value_x和value_y分别为合并前的df1和df2中的value列,为避免列名重复,merge()函数默认在列名后加上_x或_y。在此例中,由于两个表中key列的交集为B和D,因此合并后只有这两行数据。
在使用merge()函数时,需要指定on参数为用于合并的列名,how参数为合并方式,包括inner、outer、left、right等。inner表示内连接,即只保留两个表中key列的交集,outer表示外连接,即保留两个表中key列的并集,left表示左连接,即保留df1表中的所有数据,同时将df2表中与df1表中key列相同的数据进行匹配合并,right表示右连接,即保留df2表中的所有数据,同时将df1表中与df2表中key列相同的数据进行匹配合并。
阅读全文