pandas显示那些重复的数据行
时间: 2023-06-27 15:08:25 浏览: 173
要显示重复的数据行,可以使用`pandas`的`duplicated`和`drop_duplicates`方法。
`duplicated`方法返回一个布尔值的Series,指示每一行是否是重复的。默认情况下,它会标记第一个出现的值不是重复值,后续出现的则认为是重复值。
例如,以下代码将显示一个DataFrame中的重复行:
```python
import pandas as pd
# 创建DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
'age': [25, 30, 35, 25],
'gender': ['F', 'M', 'M', 'F']}
df = pd.DataFrame(data)
# 找出重复行
duplicate_rows = df.duplicated()
print(duplicate_rows)
```
输出:
```
0 False
1 False
2 False
3 True
dtype: bool
```
可以看到,第4行被标记为重复行。
要删除重复行,可以使用`drop_duplicates`方法。默认情况下,它会保留第一个出现的值,删除后续出现的重复值。
例如,以下代码将删除DataFrame中的重复行:
```python
# 删除重复行
df = df.drop_duplicates()
print(df)
```
输出:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
```
阅读全文