python 对df列数据去重
时间: 2023-08-12 19:21:00 浏览: 58
python给excel的列数据去重
可以使用 Pandas 库中的 drop_duplicates() 方法对 DataFrame 中的列数据进行去重。例如,假设有一个 DataFrame df,其中有一列数据需要去重,可以使用以下代码:
```
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 2, 3, 3, 3, 4, 5, 5]})
df = df.drop_duplicates(subset=['A'])
print(df)
```
输出结果为:
```
A
0 1
1 2
3 3
6 4
7 5
```
即成功将 DataFrame 中的重复元素去除,并保留第一次出现的元素。其中,subset 参数指定要对哪些列进行去重,默认对所有列进行去重。
阅读全文