pandas merge按照两个字段模糊匹配
时间: 2023-07-11 14:52:00 浏览: 109
可以使用`merge`函数中的`on`参数指定需要按照哪些字段进行合并,然后使用`str.contains()`函数进行模糊匹配。示例如下:
假设有两个DataFrame:`df1` 和 `df2`,需要按照`df1`中的列`A`和`B`与`df2`中的列`C`和`D`进行模糊匹配合并,代码如下:
```python
import pandas as pd
df1 = pd.DataFrame({'A': ['apple', 'banana', 'pear'], 'B': ['red', 'yellow', 'green'], 'value': [1, 2, 3]})
df2 = pd.DataFrame({'C': ['apple inc', 'banana fruit', 'pear company'], 'D': ['red color', 'yellow color', 'green leaf'], 'score': [10, 20, 30]})
df1['key'] = df1['A'] + df1['B'] # 拼接两个字段作为合并的键
df2['key'] = df2['C'] + df2['D']
merged = pd.merge(df1, df2, on='key') # 按照拼接后的字段合并
merged.drop('key', axis=1, inplace=True) # 去掉拼接后的字段
print(merged)
```
输出结果为:
```
A B value C D score
0 apple red 1 apple inc red color 10
1 banana yellow 2 banana fruit yellow color 20
2 pear green 3 pear company green leaf 30
```
在上述代码中,`df1`和`df2`中都新增了一个名为`key`的列,该列为拼接后的字段,然后使用`merge`函数按照该列进行合并。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)