首页Python duplicated的用法

Python duplicated的用法

时间: 2023-06-14 15:03:07 浏览: 187

Python中的`duplicated`函数位于`pandas`库中，用于查找DataFrame或Series中的重复值，并返回一个布尔类型的数组，表示每个元素是否是重复的。 `duplicated`函数有以下常用参数： - `subset`：指定用于判断重复的列，默认为所有列。 - `keep`：指定保留哪个重复值。可选值为`first`（保留第一个出现的重复值）、`last`（保留最后一个出现的重复值）和`False`（全部删除），默认为`first`。以下是`duplicated`函数的示例用法： ```python import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Alice'], 'age': [25, 30, 35, 40, 25]} df = pd.DataFrame(data) # 查找重复行 print(df.duplicated()) # 查找重复姓名 print(df.duplicated(subset=['name'])) # 删除重复行 df = df.drop_duplicates() print(df) ``` 输出结果为： ``` 0 False 1 False 2 False 3 False 4 True dtype: bool 0 False 1 False 2 False 3 False 4 True dtype: bool name age 0 Alice 25 1 Bob 30 2 Charlie 35 3 David 40 ```

阅读全文