cols = ['text', 'label'] # 查找重复的行 duplicated = df.duplicated(cols, keep=False) # 返回所有重复的行 result = df[duplicated]
时间: 2023-10-09 09:04:28 浏览: 93
python实现查找excel里某一列重复数据并且剔除后打印的方法
5星 · 资源好评率100%
这是一个针对 pandas 数据库 df 的 Python 代码段,目的是查找 df 中所有重复的行,并将结果存储在 result 中。其中,cols 是一个包含需要检查重复的列名的列表,duplicated 变量是一个布尔型 Series,其中包含了 df 中所有重复的行,keep=False 表示保留所有重复的行,而不是只保留第一个或最后一个重复的行。最后,df[duplicated] 将返回所有重复的行,存储在 result 变量中。
阅读全文