pd.concat连接两个表,合并重复
时间: 2023-06-23 18:08:14 浏览: 139
详解pandas数据合并与重塑(pd.concat篇)
使用 `pd.concat` 函数可以将两个表按照行或列进行合并。如果两个表存在重复的行或列,可以使用参数来进行去重。下面是一个例子:
假设有两个表 `df1` 和 `df2`:
```python
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]})
df2 = pd.DataFrame({'A': [1, 2, 4],
'B': [4, 5, 7],
'C': [7, 8, 10]})
```
现在我们想要将这两个表按照列进行合并,同时去除重复的行。可以使用如下的代码:
```python
result = pd.concat([df1, df2], axis=1, join='inner')
result = result.loc[:,~result.columns.duplicated()]
```
这里使用了 `pd.concat` 函数来将两个表按照列进行合并,并且使用了 `join='inner'` 参数来去除重复的行。此外,由于 `pd.concat` 函数默认会保留重复的列名,因此我们使用了 `loc[:,~result.columns.duplicated()]` 来去除重复的列。
阅读全文