pandas 对列去重
时间: 2023-07-11 22:20:47 浏览: 137
pandas去除重复列的实现方法
你可以使用 `drop_duplicates()` 方法对 DataFrame 中的某一列去重。例如,如果你有一个名为 `df` 的 DataFrame,其中有一列名为 `column_name`,你可以使用以下代码对该列进行去重:
```
df.drop_duplicates(subset=['column_name'], keep='first', inplace=True)
```
其中,`subset` 参数指定要去重的列(可以是多列),`keep` 参数指定保留哪个重复项(默认为 `'first'`,即保留第一个重复项),`inplace` 参数指定是否在原 DataFrame 上进行修改(默认为 `False`,即返回一个新的 DataFrame)。
如果你想要对整个 DataFrame 进行去重,可以省略 `subset` 参数:
```
df.drop_duplicates(keep='first', inplace=True)
```
这将对整个 DataFrame 进行去重,并保留第一个重复项。
阅读全文