dataframe如果一行有重名,则保留这一行相同元素的第一个列,删除多出来的相同列名的列
时间: 2024-03-22 16:42:16 浏览: 200
pandas DataFrame 删除重复的行的实现方法
5星 · 资源好评率100%
可以使用 pandas 中的 `drop_duplicates` 方法来实现这个功能。该方法默认会对 DataFrame 的所有列进行去重,如果希望只对某些列进行去重,可以通过 `subset` 参数指定。
以下是一个示例代码,假设 DataFrame 名称为 `df`:
```python
# 删除所有列重复的行,保留第一个出现的行
df = df.drop_duplicates()
# 只对某些列进行去重
df = df.drop_duplicates(subset=['col1', 'col2'])
```
在第二个示例中,只会对 `col1` 和 `col2` 两列进行去重,其他列的重复行仍会保留。如果某行在 `col1` 和 `col2` 两列的值都与之前出现的某行相同,则该行会被删除,只保留第一个出现的行。
阅读全文