我需要判断一个dafame中第三列中重复最多的数 保留这些数对应的其他列
时间: 2024-03-23 18:42:52 浏览: 47
你可以使用 pandas 库来处理这个问题。首先,读取数据到 DataFrame 中,然后使用 value_counts() 函数来统计第三列中每个数值出现的次数。接着,使用 idxmax() 函数找到出现次数最多的数值,最后使用 loc[] 函数来选择对应的行,并保留其他列。
示例代码:
``` python
import pandas as pd
# 读取数据到 DataFrame
df = pd.read_csv('your_file.csv')
# 统计第三列中每个数值出现的次数
counts = df.iloc[:, 2].value_counts()
# 找到出现次数最多的数值
most_common_value = counts.idxmax()
# 选择对应的行,并保留其他列
result = df.loc[df.iloc[:, 2] == most_common_value, :]
```
其中,'your_file.csv' 是你的数据文件名。result 变量即为筛选出来的结果,包含了第三列中出现次数最多的数值所对应的所有行,并保留了其他列。
阅读全文