pandas删除重复行
时间: 2023-05-17 08:03:18 浏览: 68
可以使用 pandas 中的 drop_duplicates() 方法来删除重复行。例如,如果我们有一个名为 df 的 pandas 数据框,我们可以使用以下代码删除其中的重复行:
df.drop_duplicates(inplace=True)
这将在原始数据框中删除重复行,并将结果保存回原始数据框。
相关问题
pandas删除重复行不保留
如果想要使用Pandas删除重复行,但是不保留任何一个重复的行,可以使用drop_duplicates方法,并将keep参数设置为False。下面是一个例子:
``` python
import pandas as pd
df = pd.DataFrame({'A': [1, 1, 2, 3, 3], 'B': ['a', 'b', 'c', 'd', 'd']})
print(df)
# 删除重复行并不保留任何一个重复的行
df.drop_duplicates(keep=False, inplace=True)
print(df)
```
输出结果为:
```
A B
0 1 a
1 1 b
2 2 c
3 3 d
4 3 d
A B
2 2 c
```
可以看到,最后只保留了一个不重复的行(第2行)。
用pandas删除所有重复行
可以使用pandas库中的drop_duplicates()方法来删除重复行。
例如,假设有一个名为df的DataFrame,它具有多个列,其中一些行是重复的。您可以使用以下代码删除所有重复行:
``` python
df.drop_duplicates(inplace=True)
```
这将在原始DataFrame中永久删除所有重复行。如果您不想修改原始DataFrame,也可以将inplace参数设置为False。
``` python
df.drop_duplicates(inplace=False)
```
另外,您也可以指定特定的列来查找和删除重复行。例如,以下代码将在“name”列中查找和删除重复行。
``` python
df.drop_duplicates(subset='name', inplace=True)
```