dataframe如何做分组去重统计
时间: 2023-07-18 20:18:48 浏览: 95
count-by-group.zip_大数据 统计_大数据分析
您可以使用pandas库来对DataFrame进行分组去重统计,具体可以按照以下步骤进行:
1. 使用groupby()方法对需要分组的列进行分组,例如:
```
grouped = df.groupby('column_name')
```
2. 对分组后的数据使用agg()方法进行聚合操作,例如:
```
result = grouped.agg({'column_name_1': 'count', 'column_name_2': 'nunique'})
```
上面的代码中,我们对两个列进行了聚合操作,其中'column_name_1'列使用了count()函数进行计数,'column_name_2'列使用了nunique()函数去重统计。
3. 最后,您可以使用reset_index()方法将分组后的结果转换为一个新的DataFrame,并且重置索引,例如:
```
result = result.reset_index()
```
这样,您就可以得到一个按照指定列分组后,对其他列进行去重统计的结果。
阅读全文