pandas查询重复数据
时间: 2023-09-09 19:11:26 浏览: 96
pandas取出重复数据的方法
您可以使用pandas的duplicated()函数来查询重复数据。该函数返回一个布尔值Series,表示每个行是否是重复的。您可以将其与DataFrame结合使用,以过滤出重复的行。
以下是一个示例代码:
```python
import pandas as pd
# 创建示例数据
data = {'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e'],
'C': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 查找重复的行
duplicated_rows = df.duplicated()
# 过滤出重复的行
duplicate_df = df[duplicated_rows]
print(duplicate_df)
```
此代码将打印出所有重复的行。您可以根据需要选择采取不同的操作,比如删除重复行或者只保留一行等。
阅读全文