# result_df = pd.merge(mongo_df, sql_server_df, how='left', left_on='userId', right_on='i_ui_identifier')怎么控制表链接后的查询结果中字段?如何写?
时间: 2024-03-16 10:45:07 浏览: 59
在使用 pd.merge() 合并两个 DataFrame 时,可以通过设置参数来控制查询结果中的字段。
- left_on 和 right_on 参数:指定左右两个 DataFrame 中用于连接的列名。在结果中,这些列将会被保留,但它们的列名会变成 left_on 或 right_on 参数中指定的名称。
- suffixes 参数:指定在两个 DataFrame 中存在同名列时,为它们添加的后缀。默认情况下,左 DataFrame 的同名列不添加后缀,右 DataFrame 的同名列添加 '_y' 后缀。
- usecols 参数:指定要在结果中包含哪些列。可以传入一个列表,包含需要的列名。
下面是一个示例代码,演示如何使用这些参数来控制查询结果中的字段。
```python
import pandas as pd
# 创建两个示例 DataFrame
df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3']})
df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']})
# 执行左连接操作,只保留 key 和 A 列
result_df = pd.merge(df1[['key', 'A']], df2, how='left', on='key', suffixes=('_df1', '_df2'))
# 打印结果
print(result_df)
```
运行结果如下:
```
key A C D
0 K0 A0 C0 D0
1 K1 A1 C1 D1
2 K2 A2 C2 D2
3 K3 A3 C3 D3
```
在上面的代码中,我们首先将 df1 和 df2 两个 DataFrame 进行左连接操作,连接键是 'key' 列。然后通过设置左 DataFrame 的列名为 ['key', 'A'],右 DataFrame 的列名为 ['C', 'D'],从而只保留了这些列。suffixes 参数指定在两个 DataFrame 中存在同名列时,为它们添加的后缀。最后得到的结果 DataFrame 只包含了 key、A、C 和 D 四列。
阅读全文