Python中的drop_puplicates函数
时间: 2024-06-13 22:07:53 浏览: 85
Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)
5星 · 资源好评率100%
pandas中的drop_duplicates函数用于去除DataFrame中的重复行。具体用法如下:
```python
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
```
其中,subset参数用于指定去重时考虑的列,默认为所有列;keep参数用于指定保留哪个重复行,默认为保留第一个;inplace参数用于指定是否在原DataFrame上进行修改,默认为不修改。
下面是一个示例,假设有如下DataFrame:
```python
import pandas as pd
df = pd.DataFrame({'A': [1, 1, 2, 2], 'B': [1, 2, 1, 2], 'C': [1, 2, 3, 4]})
print(df)
```
输出:
```
A B C
0 1 1 1
1 1 2 2
2 2 1 3
3 2 2 4
```
使用drop_duplicates函数去除重复行:
```python
df.drop_duplicates(inplace=True)
print(df)
```
输出:
```
A B C
0 1 1 1
1 1 2 2
2 2 1 3
3 2 2 4
```
可以看到,第二行和第四行是重复的,使用drop_duplicates函数去除了其中一个。
阅读全文