pandas删除重复行不保留
时间: 2023-07-31 07:09:00 浏览: 43
如果想要使用Pandas删除重复行,但是不保留任何一个重复的行,可以使用drop_duplicates方法,并将keep参数设置为False。下面是一个例子:
``` python
import pandas as pd
df = pd.DataFrame({'A': [1, 1, 2, 3, 3], 'B': ['a', 'b', 'c', 'd', 'd']})
print(df)
# 删除重复行并不保留任何一个重复的行
df.drop_duplicates(keep=False, inplace=True)
print(df)
```
输出结果为:
```
A B
0 1 a
1 1 b
2 2 c
3 3 d
4 3 d
A B
2 2 c
```
可以看到,最后只保留了一个不重复的行(第2行)。
相关问题
pandas检测重复行,保留最后一行,删去其余行
你可以使用`drop_duplicates()`函数,将参数`keep`设置为`last`,表示保留最后一行,同时将参数`inplace`设置为`True`,表示直接在原始DataFrame上进行修改。示例代码如下:
```python
import pandas as pd
# 创建DataFrame
df = pd.DataFrame({'A': [1, 2, 2, 3, 4], 'B': [4, 5, 6, 7, 8]})
# 检测重复行,保留最后一行
df.drop_duplicates(keep='last', inplace=True)
```
执行完上述代码后,`df`将只保留最后一行重复数据,其余行被删除。
pandas去重复行数据
在pandas中可以使用drop_duplicates()函数去重复行数据。
例如,有一个数据框df:
```
import pandas as pd
data = {'name': ['Tom', 'Tom', 'Jerry', 'Jerry', 'Mickey'],
'age': [20, 20, 21, 21, 22],
'score': [90, 90, 85, 85, 95]}
df = pd.DataFrame(data)
print(df)
```
输出:
```
name age score
0 Tom 20 90
1 Tom 20 90
2 Jerry 21 85
3 Jerry 21 85
4 Mickey 22 95
```
使用drop_duplicates()函数去重复行数据:
```
df = df.drop_duplicates()
print(df)
```
输出:
```
name age score
0 Tom 20 90
2 Jerry 21 85
4 Mickey 22 95
```
可以看到,重复的行数据被删除了,只保留了不重复的行数据。