pandas对列数据去重
时间: 2023-10-13 09:23:40 浏览: 136
pandas去除重复列的实现方法
可以使用 `drop_duplicates()` 方法对 pandas 数据库中的列数据进行去重,例如:
```python
import pandas as pd
# 创建一个包含重复数据的 DataFrame
data = {'fruit': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana'],
'count': [2, 3, 1, 4, 2, 1]}
df = pd.DataFrame(data)
# 对 'fruit' 列进行去重
df_fruit = df.drop_duplicates('fruit')
print(df_fruit)
```
输出结果为:
```
fruit count
0 apple 2
1 banana 3
3 orange 4
```
在这个例子中,我们先创建了一个包含重复数据的 DataFrame,然后使用 `drop_duplicates()` 方法对 'fruit' 列进行去重,最终得到一个仅包含不重复 'fruit' 列的 DataFrame。
阅读全文