pandas多列排序删除重复项
时间: 2023-10-15 14:07:23 浏览: 127
您可以使用pandas库中的sort_values()函数进行多列排序,然后使用drop_duplicates()函数删除重复项。
示例代码:
```
import pandas as pd
# 创建示例数据
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
'age': [25, 30, 35, 25, 30],
'gender': ['female', 'male', 'male', 'female', 'male']}
df = pd.DataFrame(data)
# 多列排序
df = df.sort_values(by=['name', 'age'])
# 删除重复项
df = df.drop_duplicates(subset=['name', 'age'], keep='first')
print(df)
```
运行结果:
```
name age gender
0 Alice 25 female
1 Bob 30 male
2 Charlie 35 male
```
代码说明:
首先,我们创建了一个包含'name'、'age'和'gender'三列的DataFrame。
然后,使用sort_values()函数对'name'和'age'两列进行排序。
最后,使用drop_duplicates()函数删除重复的'name'和'age'组合,并保留第一个出现的组合。
注意,keep参数表示保留哪个重复项,'first'表示保留第一个出现的项,'last'表示保留最后一个出现的项,False表示删除所有重复项。
阅读全文
相关推荐
![-](https://img-home.csdnimg.cn/images/20241231044955.png)
![-](https://img-home.csdnimg.cn/images/20241231045053.png)
![-](https://img-home.csdnimg.cn/images/20241231044930.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![-](https://img-home.csdnimg.cn/images/20250102104920.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)