首页找出一个表格中每一行第一列重复的行

找出一个表格中每一行第一列重复的行

时间: 2024-02-12 12:09:00 浏览: 25

你可以使用 Pandas 中的 `duplicated()` 函数和布尔索引来找出表格中每一行第一列重复的行。具体来说，你可以使用 `duplicated()` 函数来找出第一列中的重复值，然后使用布尔索引来选择对应的行。例如，假设你有如下的表格： ``` import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'David'], 'age': [25, 30, 35, 25, 40], 'gender': ['F', 'M', 'M', 'F', 'M']} df = pd.DataFrame(data) print(df) ``` 输出： ``` name age gender 0 Alice 25 F 1 Bob 30 M 2 Charlie 35 M 3 Alice 25 F 4 David 40 M ``` 你可以使用 `duplicated()` 函数找出第一列中的重复值： ``` duplicated_names = df.duplicated(subset=['name'], keep=False) print(duplicated_names) ``` 输出： ``` 0 True 1 False 2 False 3 True 4 False dtype: bool ``` 你可以看到，第 0 行和第 3 行的第一列都是重复的。现在，你可以使用布尔索引来选择这些行： ``` duplicate_rows = df[duplicated_names] print(duplicate_rows) ``` 输出： ``` name age gender 0 Alice 25 F 3 Alice 25 F ``` 你可以看到，这个表格中每一行第一列重复的行是第 0 行和第 3 行。