pandas中,有很多行的a列和b列同时重复,只保留重复数据中的一行,求代码
时间: 2023-05-19 17:07:17 浏览: 51
可以使用pandas库中的drop_duplicates()方法来实现:
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=True)
其中,subset参数指定要去重的列,keep参数指定保留哪一行('first'表示保留第一行,'last'表示保留最后一行),inplace参数指定是否在原数据上进行修改。
相关问题
pandas中,有很多行的a列和b列同时重复,只保留重复数据中的一行,求代码
可以使用pandas库中的drop_duplicates()函数来实现:
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=True)
其中,subset参数指定需要去重的列,keep参数指定保留哪一个重复数据,inplace参数指定是否在原数据上进行修改。
pandas只保留a列和b列同时相同的一行
可以使用以下代码实现:
```python
import pandas as pd
# 创建示例数据
data = {'a': [1, 2, 3, 4], 'b': [2, 3, 4, 5], 'c': [3, 4, 5, 6]}
df = pd.DataFrame(data)
# 只保留a列和b列同时相同的一行
df = df[df.duplicated(['a', 'b'], keep=False)]
```
这段代码会删除所有不满足条件的行,只保留a列和b列同时相同的一行。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)