首页duplicated()

duplicated()

时间: 2023-06-23 14:51:57 浏览: 94

`duplicated()`方法用于返回一个布尔类型的Series，表示每行是否为重复行。默认情况下，所有列都会被考虑，但也可以使用`subset`参数指定只考虑某些列。`duplicated()`方法还可以使用`keep`参数指定保留哪些重复行。使用方法示例： ```python import pandas as pd # 创建一个包含重复行的DataFrame df = pd.DataFrame({'A': [1, 2, 3, 1], 'B': [4, 5, 6, 4]}) # 打印DataFrame print(df) # 输出每行是否为重复行 print(df.duplicated()) # 输出不包括第一次出现的重复行 print(df.duplicated(keep='first')) # 输出不包括最后一次出现的重复行 print(df.duplicated(keep='last')) # 只考虑'A'列，输出每行是否为重复行 print(df.duplicated(subset='A')) # 只考虑'B'列，输出每行是否为重复行 print(df.duplicated(subset='B')) ``` 输出结果如下： ``` A B 0 1 4 1 2 5 2 3 6 3 1 4 0 False 1 False 2 False 3 True dtype: bool 0 False 1 False 2 False 3 True dtype: bool 0 False 1 False 2 True 3 False dtype: bool 0 False 1 False 2 False 3 True dtype: bool 0 True 1 True 2 True 3 False dtype: bool 0 True 1 True 2 True 3 False dtype: bool ``` 可以看到，`duplicated()`方法返回的是一个布尔类型的Series，表示每行是否为重复行。可以使用`keep`参数指定保留哪些重复行，使用`subset`参数指定只考虑某些列。

阅读全文