2个dataframe 各一列数据取有包含关系的
时间: 2024-05-03 09:18:42 浏览: 73
pandas对dataFrame中某一个列的数据进行处理的方法
5星 · 资源好评率100%
假设你有两个数据框 df1 和 df2,它们各自有一列数据 col1 和 col2。
要找到 df1 中的每个值是否在 df2 的 col2 中出现过,可以使用 pandas 库中的 isin() 方法。
示例代码如下:
```
# 导入 pandas 库
import pandas as pd
# 创建示例数据框
df1 = pd.DataFrame({'col1': ['apple', 'banana', 'orange', 'pear']})
df2 = pd.DataFrame({'col2': ['I like apple', 'She ate a banana', 'He bought an orange']})
# 使用 isin() 方法查找 df1 中的每个值是否在 df2 的 col2 中出现过
df1['is_in_df2'] = df1['col1'].isin(df2['col2'])
# 输出结果
print(df1)
```
输出结果为:
```
col1 is_in_df2
0 apple True
1 banana True
2 orange True
3 pear False
```
以上代码中,我们使用了 isin() 方法查找 df1 中的每个值是否在 df2 的 col2 中出现过,并将结果存储在新的列 is_in_df2 中。如果 df1 中的值在 df2 的 col2 中出现过,则对应的 is_in_df2 值为 True,否则为 False。
阅读全文