首页我需要判断一个dafame中第三列中重复最多的数保留这些数对应的其他列

我需要判断一个dafame中第三列中重复最多的数保留这些数对应的其他列

时间: 2024-03-23 18:42:52 浏览: 47

你可以使用 pandas 库来处理这个问题。首先，读取数据到 DataFrame 中，然后使用 value_counts() 函数来统计第三列中每个数值出现的次数。接着，使用 idxmax() 函数找到出现次数最多的数值，最后使用 loc[] 函数来选择对应的行，并保留其他列。示例代码： ``` python import pandas as pd # 读取数据到 DataFrame df = pd.read_csv('your_file.csv') # 统计第三列中每个数值出现的次数 counts = df.iloc[:, 2].value_counts() # 找到出现次数最多的数值 most_common_value = counts.idxmax() # 选择对应的行，并保留其他列 result = df.loc[df.iloc[:, 2] == most_common_value, :] ``` 其中，'your_file.csv' 是你的数据文件名。result 变量即为筛选出来的结果，包含了第三列中出现次数最多的数值所对应的所有行，并保留了其他列。

阅读全文