首页pandas中，有很多行的a列和b列同时重复，只保留重复数据中的一行，求代码

pandas中，有很多行的a列和b列同时重复，只保留重复数据中的一行，求代码

时间: 2023-05-19 17:07:17 浏览: 51

可以使用pandas库中的drop_duplicates()方法来实现： df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=True) 其中，subset参数指定要去重的列，keep参数指定保留哪一行（'first'表示保留第一行，'last'表示保留最后一行），inplace参数指定是否在原数据上进行修改。

pandas中,有很多行的a列和b列同时重复,只保留重复数据中的一行,求代码

可以使用pandas库中的drop_duplicates()函数来实现： df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=True) 其中，subset参数指定需要去重的列，keep参数指定保留哪一个重复数据，inplace参数指定是否在原数据上进行修改。

pandas只保留a列和b列同时相同的一行

可以使用以下代码实现： ```python import pandas as pd # 创建示例数据 data = {'a': [1, 2, 3, 4], 'b': [2, 3, 4, 5], 'c': [3, 4, 5, 6]} df = pd.DataFrame(data) # 只保留a列和b列同时相同的一行 df = df[df.duplicated(['a', 'b'], keep=False)] ``` 这段代码会删除所有不满足条件的行，只保留a列和b列同时相同的一行。

最新推荐

pandas中，有很多行的a列和b列同时重复，只保留重复数据中的一行，求代码