如何查看dataframe中某两列都相同的数据
时间: 2023-12-15 18:06:24 浏览: 142
要查看 DataFrame 中某两列都相同的数据,可以使用 Pandas 库中的 `.duplicated()` 方法。具体步骤如下:
1. 选择要比较的两列,假设分别为 column1 和 column2。
2. 使用 `.duplicated(['column1', 'column2'], keep=False)` 方法,其中 `keep=False` 表示将重复的所有行都标记为 True,而不是只标记第一个出现的行。
3. 将返回的布尔型 Series 应用于原 DataFrame 中,即可得到所有重复的行。
示例代码如下:
```python
import pandas as pd
# 示例 DataFrame
df = pd.DataFrame({
'column1': [1, 2, 3, 4, 5, 1, 2, 3],
'column2': ['A', 'B', 'C', 'D', 'E', 'A', 'B', 'C'],
'column3': ['apple', 'banana', 'orange', 'apple', 'banana', 'orange', 'apple', 'banana']
})
# 选择要比较的两列,即 column1 和 column2
cols = ['column1', 'column2']
# 查找重复的行
duplicated = df.duplicated(cols, keep=False)
# 返回所有重复的行
result = df[duplicated]
print(result)
```
输出结果为:
```
column1 column2 column3
0 1 A apple
5 1 A orange
1 2 B banana
6 2 B apple
2 3 C orange
7 3 C banana
```
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)