找出一个表格中每一行第一列重复的行
时间: 2024-02-12 12:09:00 浏览: 25
你可以使用 Pandas 中的 `duplicated()` 函数和布尔索引来找出表格中每一行第一列重复的行。具体来说,你可以使用 `duplicated()` 函数来找出第一列中的重复值,然后使用布尔索引来选择对应的行。例如,假设你有如下的表格:
```
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'David'],
'age': [25, 30, 35, 25, 40],
'gender': ['F', 'M', 'M', 'F', 'M']}
df = pd.DataFrame(data)
print(df)
```
输出:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
3 Alice 25 F
4 David 40 M
```
你可以使用 `duplicated()` 函数找出第一列中的重复值:
```
duplicated_names = df.duplicated(subset=['name'], keep=False)
print(duplicated_names)
```
输出:
```
0 True
1 False
2 False
3 True
4 False
dtype: bool
```
你可以看到,第 0 行和第 3 行的第一列都是重复的。现在,你可以使用布尔索引来选择这些行:
```
duplicate_rows = df[duplicated_names]
print(duplicate_rows)
```
输出:
```
name age gender
0 Alice 25 F
3 Alice 25 F
```
你可以看到,这个表格中每一行第一列重复的行是第 0 行和第 3 行。