data.groupby
时间: 2023-07-30 18:06:11 浏览: 91
Python DataFrame.groupby()聚合函数,分组级运算
5星 · 资源好评率100%
`groupby` 是 Pandas 中非常强大的功能之一,可以按照某个或某些列的值进行分组,然后对各个分组进行聚合操作。其语法格式为:
```python
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)
```
其中常用的参数包括:
- `by`:指定按照哪个或哪些列进行分组,可以是列名、列索引、列表、数组、Series 等。
- `axis`:指定按照哪个轴进行分组,0 表示按照行进行分组,1 表示按照列进行分组。
- `level`:指定按照哪个级别进行分组,如果是多层索引的情况下。
- `as_index`:指定是否将分组列作为索引,如果为 False,则分组列会作为一般的列出现在结果中。
- `sort`:指定是否按照分组列排序。
- `group_keys`:指定是否在结果中包含分组键。
`groupby` 返回一个 GroupBy 对象,可以对该对象进行各种聚合操作,例如求和、平均值、中位数、最大值、最小值等。常用的聚合函数包括 `sum`、`mean`、`median`、`max`、`min` 等。例如:
```python
import pandas as pd
data = pd.read_csv('data.csv')
grouped = data.groupby('category')
result = grouped.mean()
```
上述代码中,首先读入一个名为 data.csv 的文件,然后按照 category 列进行分组,最后对每个分组计算平均值。
阅读全文