group by pandas
时间: 2024-08-29 15:00:34 浏览: 49
Pandas GroupBy对象 索引与迭代方法
group by 是 Pandas 库中的一项功能,它允许用户根据数据集中的某个列或多列对数据进行分组,并针对每个组应用聚合函数(如计算平均值、总和、计数等)。这一操作通常用于数据分析和预处理阶段,可以帮助我们发现数据中的模式和趋势。
例如,如果你有一个包含销售记录的数据框,你可以按照产品类别 `group by` 类别,然后分别计算每个类别的销售额总和、平均价格等。Pandas 提供了诸如 `sum()`、`mean()`、`count()` 等内置聚合函数,也可以自定义函数进行复杂分析。
下面是一个简单的例子:
```python
import pandas as pd
# 假设 df 是一个 DataFrame,有 columns ['Category', 'Price', 'Quantity']
grouped_df = df.groupby('Category').agg({'Price': 'mean', 'Quantity': 'sum'})
# 输出每个类别的平均价格和销售总量
print(grouped_df)
```
阅读全文