duplicated()函数
时间: 2023-10-09 10:09:20 浏览: 95
`duplicated()`函数是Pandas库中的一个函数,用于检查DataFrame或Series中是否存在重复的行或元素。它返回一个布尔类型的Series,其中为True的表示该行或元素是重复的。
下面是一个使用`duplicated()`函数的示例:
```python
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
'age': [25, 30, 35, 25],
'gender': ['F', 'M', 'M', 'F']}
df = pd.DataFrame(data)
# 检查DataFrame中是否存在重复的行
print(df.duplicated())
# 输出结果:
# 0 False
# 1 False
# 2 False
# 3 True
# dtype: bool
# 删除重复的行
df.drop_duplicates(inplace=True)
print(df)
# 输出结果:
# name age gender
# 0 Alice 25 F
# 1 Bob 30 M
# 2 Charlie 35 M
```
在上面的示例中,我们创建了一个包含重复行的DataFrame,并使用`duplicated()`函数检查是否存在重复行。然后,我们使用`drop_duplicates()`函数删除重复的行,并输出结果。
阅读全文