drop_duplicates的用法
时间: 2023-07-26 18:05:00 浏览: 156
Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)
5星 · 资源好评率100%
drop_duplicates 是 pandas 库中的一个函数,用于去除 DataFrame 或 Series 中的重复值。
在 DataFrame 中使用 drop_duplicates 函数时,可以指定某些列作为判断重复的依据。具体用法如下:
```python
df.drop_duplicates(subset=None, keep='first', inplace=False)
```
其中,参数说明如下:
- `subset`:可选参数,用于指定判断重复的列,默认为 None,表示所有列都参与判断。
- `keep`:可选参数,用于指定保留重复值的策略,默认为 'first',表示保留第一个出现的值,其他重复值都会被删除。还可以设置为 'last',表示保留最后一个出现的值,或者设置为 False,表示删除所有重复值。
- `inplace`:可选参数,是否在原 DataFrame 上进行修改,默认为 False,表示返回一个新的 DataFrame,不对原 DataFrame 进行修改;若设置为 True,则在原 DataFrame 上进行修改,并返回 None。
在 Series 中使用 drop_duplicates 函数时,用法与 DataFrame 类似,只是不需要指定 subset 参数。示例如下:
```python
series.drop_duplicates(keep='first', inplace=False)
```
希望能帮到你!如果还有其他问题,请继续提问。
阅读全文