pandas删除重复行
时间: 2023-10-13 15:10:13 浏览: 54
要删除 pandas DataFrame 中的重复行,可以使用 `drop_duplicates()` 方法。该方法默认会比较所有列,如果有一行与另一行完全相同,则被视为重复行。
以下是一个示例代码:
``` python
import pandas as pd
# 创建一个包含重复行的 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
'age': [25, 30, 35, 25],
'gender': ['F', 'M', 'M', 'F']}
df = pd.DataFrame(data)
# 删除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果如下:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
```
在上面的示例中,我们首先创建一个包含重复行的 DataFrame,然后使用 `drop_duplicates()` 方法删除了这些重复行。最后,打印了结果以验证删除操作是否正确。
相关问题
pandas删除重复行不保留
如果想要使用Pandas删除重复行,但是不保留任何一个重复的行,可以使用drop_duplicates方法,并将keep参数设置为False。下面是一个例子:
``` python
import pandas as pd
df = pd.DataFrame({'A': [1, 1, 2, 3, 3], 'B': ['a', 'b', 'c', 'd', 'd']})
print(df)
# 删除重复行并不保留任何一个重复的行
df.drop_duplicates(keep=False, inplace=True)
print(df)
```
输出结果为:
```
A B
0 1 a
1 1 b
2 2 c
3 3 d
4 3 d
A B
2 2 c
```
可以看到,最后只保留了一个不重复的行(第2行)。
用pandas删除所有重复行
可以使用pandas库中的drop_duplicates()方法来删除重复行。
例如,假设有一个名为df的DataFrame,它具有多个列,其中一些行是重复的。您可以使用以下代码删除所有重复行:
``` python
df.drop_duplicates(inplace=True)
```
这将在原始DataFrame中永久删除所有重复行。如果您不想修改原始DataFrame,也可以将inplace参数设置为False。
``` python
df.drop_duplicates(inplace=False)
```
另外,您也可以指定特定的列来查找和删除重复行。例如,以下代码将在“name”列中查找和删除重复行。
``` python
df.drop_duplicates(subset='name', inplace=True)
```