Python duplicated的用法
时间: 2023-06-14 15:03:07 浏览: 187
Python中的`duplicated`函数位于`pandas`库中,用于查找DataFrame或Series中的重复值,并返回一个布尔类型的数组,表示每个元素是否是重复的。
`duplicated`函数有以下常用参数:
- `subset`:指定用于判断重复的列,默认为所有列。
- `keep`:指定保留哪个重复值。可选值为`first`(保留第一个出现的重复值)、`last`(保留最后一个出现的重复值)和`False`(全部删除),默认为`first`。
以下是`duplicated`函数的示例用法:
```python
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Alice'],
'age': [25, 30, 35, 40, 25]}
df = pd.DataFrame(data)
# 查找重复行
print(df.duplicated())
# 查找重复姓名
print(df.duplicated(subset=['name']))
# 删除重复行
df = df.drop_duplicates()
print(df)
```
输出结果为:
```
0 False
1 False
2 False
3 False
4 True
dtype: bool
0 False
1 False
2 False
3 False
4 True
dtype: bool
name age
0 Alice 25
1 Bob 30
2 Charlie 35
3 David 40
```
阅读全文
相关推荐


















