DataFrame的duplicates方法可以用来删除重复数据。
时间: 2023-06-20 12:09:06 浏览: 47
是的,你说的对。DataFrame的duplicates方法可以用来检测和删除重复数据。该方法返回一个布尔型的Series,指示哪些行是重复的。如果你想保留其中的一行,可以使用drop_duplicates方法来删除重复行。例如,假设我们有一个名为df的DataFrame,其中包含重复的行:
```
import pandas as pd
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'baz', 'foo'],
'B': ['one', 'one', 'two', 'two', 'one', 'two'],
'C': [1, 2, 3, 4, 5, 6]})
print(df)
```
输出如下:
```
A B C
0 foo one 1
1 bar one 2
2 foo two 3
3 bar two 4
4 baz one 5
5 foo two 6
```
我们可以使用duplicates方法来检测重复行:
```
print(df.duplicated())
```
输出如下:
```
0 False
1 False
2 False
3 False
4 False
5 True
dtype: bool
```
我们可以看到,第5行是重复的。现在我们可以使用drop_duplicates方法来删除重复行:
```
df = df.drop_duplicates()
print(df)
```
输出如下:
```
A B C
0 foo one 1
1 bar one 2
2 foo two 3
3 bar two 4
4 baz one 5
```