dataframe求交集
时间: 2023-11-18 18:15:08 浏览: 97
pandas DataFrame 交集并集补集的实现
在使用pyspark的Dataframe求交集时,可以使用intersect()函数来实现。首先,需要准备好要求交集的两个Dataframe。然后,使用intersect()函数将两个Dataframe中的相同行进行匹配,并返回交集的结果。例如,可以使用以下代码实现求交集操作:
```python
newDF_intersect = sentenceDataFrame1.select("sentence").intersect(sentenceDataFrame.select("sentence"))
newDF_intersect.show()
```
这段代码会将两个Dataframe中的"sentence"列进行比较,找出相同的行并返回结果。最后,使用show()函数展示交集的结果。
通过以上方法,你就可以很方便地求出Dataframe的交集了。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [pyspark案例系列8-Dataframe的求差集、交集 、并集](https://blog.csdn.net/u010520724/article/details/125271481)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文