duplicated()
时间: 2023-06-23 14:51:57 浏览: 94
`duplicated()`方法用于返回一个布尔类型的Series,表示每行是否为重复行。默认情况下,所有列都会被考虑,但也可以使用`subset`参数指定只考虑某些列。`duplicated()`方法还可以使用`keep`参数指定保留哪些重复行。
使用方法示例:
```python
import pandas as pd
# 创建一个包含重复行的DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 1], 'B': [4, 5, 6, 4]})
# 打印DataFrame
print(df)
# 输出每行是否为重复行
print(df.duplicated())
# 输出不包括第一次出现的重复行
print(df.duplicated(keep='first'))
# 输出不包括最后一次出现的重复行
print(df.duplicated(keep='last'))
# 只考虑'A'列,输出每行是否为重复行
print(df.duplicated(subset='A'))
# 只考虑'B'列,输出每行是否为重复行
print(df.duplicated(subset='B'))
```
输出结果如下:
```
A B
0 1 4
1 2 5
2 3 6
3 1 4
0 False
1 False
2 False
3 True
dtype: bool
0 False
1 False
2 False
3 True
dtype: bool
0 False
1 False
2 True
3 False
dtype: bool
0 False
1 False
2 False
3 True
dtype: bool
0 True
1 True
2 True
3 False
dtype: bool
0 True
1 True
2 True
3 False
dtype: bool
```
可以看到,`duplicated()`方法返回的是一个布尔类型的Series,表示每行是否为重复行。可以使用`keep`参数指定保留哪些重复行,使用`subset`参数指定只考虑某些列。
阅读全文