用python判断datafram数据中某列是否重复并返回重复
时间: 2023-12-24 15:06:05 浏览: 62
Python实现判断给定列表是否有重复元素的方法
如果你想要获取 DataFrame 中某列的重复值所在的行,可以使用 Pandas 库中的 `duplicated` 方法的 `keep=False` 参数,配合布尔索引来获取重复的行,具体代码如下:
```python
# 获取 df 中某列 col_name 的重复行
duplicated_rows = df[df.duplicated(subset=[col_name], keep=False)]
if len(duplicated_rows) > 0:
print(f"{col_name} 存在重复值,重复的行为:")
print(duplicated_rows)
else:
print(f"{col_name} 不存在重复值")
```
其中,`duplicated` 方法的 `subset` 参数指定了需要比较的列,`keep=False` 参数表示将所有重复的行都保留,而不是只保留第一个或最后一个重复的行。如果存在重复的行,`duplicated_rows` 将会是一个 DataFrame,包含所有重复的行,你可以通过打印它来查看重复的行。如果不存在重复的行,`duplicated_rows` 将会是一个空的 DataFrame。
阅读全文