找出一个表格中重复的行
时间: 2024-02-12 09:08:56 浏览: 29
你可以使用 Pandas 中的 `duplicated()` 函数来找出表格中的重复行。该函数返回一个布尔值的 Series,其中 `True` 表示对应的行是重复的,`False` 表示对应的行不是重复的。默认情况下,该函数会将所有列都考虑在内,如果两行的所有值都相同,则认为它们是重复的。例如,假设你有如下的表格:
```
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'David'],
'age': [25, 30, 35, 25, 40],
'gender': ['F', 'M', 'M', 'F', 'M']}
df = pd.DataFrame(data)
print(df)
```
输出:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
3 Alice 25 F
4 David 40 M
```
你可以使用 `duplicated()` 函数来找出其中的重复行:
```
duplicated_rows = df.duplicated()
print(duplicated_rows)
```
输出:
```
0 False
1 False
2 False
3 True
4 False
dtype: bool
```
你可以看到,第 0 行、第 1 行和第 2 行都不是重复的,而第 3 行是重复的。你也可以使用 `keep` 参数来控制哪些行被认为是重复的。如果将 `keep` 参数设置为 `'first'`,则只有除第一个出现的重复行以外的行会被标记为重复。如果将 `keep` 参数设置为 `'last'`,则只有除最后一个出现的重复行以外的行会被标记为重复。例如,你可以这样使用 `duplicated()` 函数来找出所有的重复行:
```
duplicated_rows = df.duplicated(keep=False)
print(duplicated_rows)
```
输出:
```
0 True
1 False
2 False
3 True
4 False
dtype: bool
```
在这个例子中,第 0 行和第 3 行都是重复行,因为它们在表格中都出现了多次。
相关推荐
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)