删除DataFrame里重复的无用数据行
时间: 2023-06-12 07:03:31 浏览: 113
删除数据表中重复记录
5星 · 资源好评率100%
要删除 DataFrame 中重复的无用数据行,可以使用 `drop_duplicates` 方法。
例如,假设我们有一个名为 `df` 的 DataFrame,其中包含重复的行,我们可以使用以下代码删除重复行:
```python
df.drop_duplicates(inplace=True)
```
其中,`inplace=True` 表示在原 DataFrame 上进行修改,而不是返回一个新的 DataFrame。如果不设置 `inplace=True`,则会返回一个新的 DataFrame,原 DataFrame 不会改变。
`drop_duplicates` 方法默认会将所有列的值都考虑在内,如果只想基于某些列去重,可以使用 `subset` 参数指定列名。例如,假设我们只想基于 `col1` 和 `col2` 两列去重,可以使用以下代码:
```python
df.drop_duplicates(subset=['col1', 'col2'], inplace=True)
```
阅读全文