python循环遍历将dataframe每一行只保留一个相同内容
时间: 2023-09-04 12:08:36 浏览: 101
【Python实例】单工作表拆分到多工作表
你可以使用 Pandas 库中的 `drop_duplicates()` 方法,该方法可以去除 DataFrame 中的重复行。
如果你只想保留每行的一个相同内容,可以指定 `subset` 参数来选择需要比较的列。
例如,假设你有以下 DataFrame:
```
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 2, 3, 3],
'B': ['a', 'b', 'b', 'c', 'c'],
'C': ['x', 'y', 'z', 'x', 'y']
})
```
其中,列 A 和 B 中有重复的值。现在,如果你只想保留每行的一个相同内容(即只保留列 A 中的重复值),可以这样做:
```
df.drop_duplicates(subset=['A'])
```
这将会返回一个新的 DataFrame,其中只保留了列 A 中的重复值的第一行:
```
A B C
0 1 a x
1 2 b y
3 3 c x
```
注意,`drop_duplicates()` 方法默认保留第一个出现的重复行,并删除后续出现的重复行。如果你想保留最后一个出现的重复行,可以指定 `keep='last'` 参数。
阅读全文