pandas 先按照某一列数据进行排序，再循环遍历排序好的数据的每一行，如果发现所要筛选列的数据发生重复，比较所有出现重复数据的行，只取出另一所要筛选列的最大值，如果不重复，继续往下遍历，取出当前行，之前所要筛选列的值

可以使用 pandas 的 `sort_values()` 方法对数据进行排序，然后使用 `groupby()` 方法按照所要筛选列进行分组，再循环遍历每个分组，对于每个分组使用 `duplicated()` 方法找出重复的行，并使用 `max()` 方法获取另一列的最大值。下面是一个示例代码： ```python import pandas as pd df = pd.DataFrame({ 'col1': [1, 2, 3, 4, 5, 6], 'col2': [10, 20, 30, 30, 40, 50], 'col3': [100, 200, 300, 400, 500, 600] }) # 按照 col2 列进行排序 df = df.sort_values(by='col2') # 按照 col2 列进行分组 groups = df.groupby('col2') # 循环遍历每个分组 for _, group_df in groups: # 找出重复的行 duplicated = group_df.duplicated(subset=['col2'], keep=False) if any(duplicated): # 取出另一列的最大值 max_col3 = group_df.loc[duplicated, 'col3'].max() # 取出重复行中 col3 最大的行 max_col3_row = group_df.loc[group_df['col3'] == max_col3].iloc[0] print(max_col3_row) else: # 取出当前行 current_row = group_df.iloc[0] print(current_row) ``` 输出结果为： ``` col1 4 col2 30 col3 400 Name: 3, dtype: int64 col1 5 col2 40 col3 500 Name: 4, dtype: int64 col1 6 col2 50 col3 600 Name: 5, dtype: int64 col1 1 col2 10 col3 100 Name: 0, dtype: int64 ```

相关推荐

pandas对dataFrame中某一个列的数据进行处理的方法

使用Pandas对数据进行筛选和排序的实现

Pandas实现一列数据分隔为两列

pandas对dataframe某一列的数据进行拼音排序

使用python 对一个datafarm中某一列的每一行数据进行排序

python循环遍历dataframe每一行不同列数据

pandas 循环获取某一列数据

用python对datafram中的某一列数据中的每行以逗号分割的数据进行排序

用python对datafram类型的数据的一列数据中某一行的数据进行排序

用pandas将csv文件一列数据遍历，保留大于等于5的数据行，其余删除

pandas 某一列中如果出现重复数据，将当前行和出现重复数据的行进行比较

pandas按照某一列中的特定数据分出对应的行

python中如何对pandas的某列 数据进行排序

用python对datafram类型的数据的某一列数据进行排序

请用pandas库读入csv文件中一列smiles数据，并按行遍历

Python数分析中按照某列分组统计这一列的数据量，并按照大小进行排序

如何用pandas遍历csv文件的某一列所有数据

对datafram数据的某一列的中文按照数据库的规则进行排序

对datafram数据的某一列的中文按照sqlite数据库的规则进行排序

最新推荐

利用pandas向一个csv文件追加写入数据的实现示例

使用Python(pandas库)处理csv数据

用Pandas和Folium做一个新冠数据可视化

使用Python Pandas处理亿级数据的方法

pandas.DataFrame删除/选取含有特定数值的行或列实例

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

解答下列问题：S—＞S；T｜T；T—＞a 构造任意项目集规范族，构造LR（0）分析表，并分析a;a

JSBSim Reference Manual

python中如何对pandas的某列数据进行排序