dataframe一列去重
时间: 2023-10-21 21:16:45 浏览: 125
Python Dataframe 指定多列去重、求差集的方法
可以使用`drop_duplicates`方法来去除DataFrame一列中的重复值,示例代码如下:
```python
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4, 4, 5],
'B': ['a', 'b', 'c', 'd', 'd', 'e']
})
# 对B列进行去重,保留第一个出现的值
df['B'] = df['B'].drop_duplicates(keep='first')
print(df)
```
输出结果为:
```
A B
0 1 a
1 2 b
2 3 c
3 4 d
5 5 e
```
其中`keep`参数用于指定去重后保留哪个值,可选值为`first`(保留第一次出现的值)、`last`(保留最后一次出现的值)和`False`(全部去除)。默认值为`first`。
阅读全文