pd.merge()用法
时间: 2024-05-10 20:11:17 浏览: 97
pd.merge()是Pandas库中用于合并数据的函数。它可以根据指定的列或索引将两个或多个DataFrame对象进行连接。下面是pd.merge()的用法:
1. 基本用法:
pd.merge(left, right, on=None, how='inner')
- left和right:要合并的两个DataFrame对象。
- on:指定用于合并的列名或索引级别。如果不指定,则会自动根据两个DataFrame对象中的相同列名进行合并。
- how:指定合并方式,默认为'inner',表示取两个DataFrame对象的交集。其他可选值包括'outer'(取并集)、'left'(以左侧DataFrame为准)、'right'(以右侧DataFrame为准)。
2. 多列合并:
pd.merge(left, right, on=['col1', 'col2'])
可以通过传递一个包含多个列名的列表来指定多列进行合并。
3. 不同列名合并:
pd.merge(left, right, left_on='col1', right_on='col2')
如果要合并的两个DataFrame对象中的列名不同,可以使用left_on和right_on参数分别指定左侧和右侧的列名。
4. 索引合并:
pd.merge(left, right, left_index=True, right_index=True)
如果要根据索引进行合并,可以将left_index和right_index参数设置为True。
5. 合并类型:
pd.merge(left, right, on='col', how='inner')
- inner:取两个DataFrame对象的交集。
- outer:取两个DataFrame对象的并集。
- left:以左侧DataFrame为准,保留左侧DataFrame的所有行。
- right:以右侧DataFrame为准,保留右侧DataFrame的所有行。
阅读全文