pandas dataframe 并集
时间: 2023-10-19 21:35:31 浏览: 109
当我们谈论pandas DataFrame的并集时,我们指的是将两个DataFrame中的数据进行合并,包括两个DataFrame中的所有唯一值。为了实现这个目标,可以使用pandas库中的concat()函数。通过concat()函数,可以将两个DataFrame按行方向进行合并,并且可以选择保留重复值或删除重复值。
首先,我们需要导入pandas库,然后创建两个DataFrame对象,我们将它们称为df1和df2。
接下来,我们可以使用concat()函数将这两个DataFrame按行方向进行合并。在concat()函数中,我们需要指定需要合并的DataFrame对象,以及axis参数设置为0,表示按行方向进行合并。
最后,我们可以使用drop_duplicates()函数来删除重复的行。这样,我们就可以得到pandas DataFrame的并集。
下面是代码示例:
import pandas as pd
# 创建两个DataFrame对象
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [3, 4, 5], 'B': [6, 7, 8]})
# 按行方向合并DataFrame
df_union = pd.concat([df1, df2], axis=0)
# 删除重复的行
df_union = df_union.drop_duplicates()
# 打印结果
print(df_union)
这段代码首先创建了两个DataFrame对象df1和df2,然后使用concat()函数将这两个DataFrame按行方向进行合并,得到了df_union对象。最后,使用drop_duplicates()函数删除了重复的行,并打印出结果。
通过这种方式,我们可以实现pandas DataFrame的并集操作。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [pandas DataFrame 交集并集补集的实现](https://download.csdn.net/download/weixin_38551143/12862489)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* *3* [pandas对dataframe的两列取交集并集](https://blog.csdn.net/hhxxss_xd/article/details/127379353)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文