python-pandas-groupby 分类重复
时间: 2023-02-11 12:07:23 浏览: 125
详解pandas使用drop_duplicates去除DataFrame重复项参数
在 Pandas 中使用 groupby 函数可以对数据进行分组。可以指定一个或多个列作为分组键,然后进行聚合操作。
如果要删除分组后重复的行,可以在 groupby 函数后使用 drop_duplicates() 方法。
例如:
```
import pandas as pd
df = pd.DataFrame({'A': ['foo', 'bar', 'baz'] * 3,
'B': [1, 2, 3] * 3,
'C': [4, 5, 6] * 3})
# 首先按 'A' 和 'B' 分组
grouped = df.groupby(['A', 'B']).sum()
# 删除分组后重复的行
grouped = grouped.drop_duplicates()
```
这将会返回一个新的 dataframe,里面没有重复行。
阅读全文