pandas中,有很多行的a列和b列同时重复,只保留重复数据中的一行,求代码
时间: 2023-05-20 20:04:23 浏览: 83
可以使用pandas库中的drop_duplicates()函数来实现:
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=True)
其中,subset参数指定需要去重的列,keep参数指定保留哪一个重复数据,inplace参数指定是否在原数据上进行修改。
相关问题
pandas中,有很多行的a列和b列同时重复,只保留重复数据中的一行,求代码
可以使用pandas库中的drop_duplicates()方法来实现:
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=True)
其中,subset参数指定要去重的列,keep参数指定保留哪一行('first'表示保留第一行,'last'表示保留最后一行),inplace参数指定是否在原数据上进行修改。
阅读全文