首页data.groupby

data.groupby

时间: 2023-07-30 18:06:11 浏览: 91

Python DataFrame.groupby()聚合函数,分组级运算

5星 · 资源好评率100%

pandas提供了一个灵活高效的groupby功能，它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键（可以是函数、数组或DataFrame列名）拆分pandas对象。计算分组摘要统计，如计数、平均值、标准差，或用户自定义函数。对DataFrame的列应用各种各样的函数。应用组内转换或其他运算，如规格化、线性回归、排名或选取子集等。计算透视表或交叉表。执行分位数分析以及其他分组分析。 groupby分组函数：　　返回值：返回重构格式的DataFrame，特别注意，groupby里面的字段内的数据重构后都会变成索引　　groupby(),一般和sum()、mean

`groupby` 是 Pandas 中非常强大的功能之一，可以按照某个或某些列的值进行分组，然后对各个分组进行聚合操作。其语法格式为： ```python DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs) ``` 其中常用的参数包括： - `by`：指定按照哪个或哪些列进行分组，可以是列名、列索引、列表、数组、Series 等。 - `axis`：指定按照哪个轴进行分组，0 表示按照行进行分组，1 表示按照列进行分组。 - `level`：指定按照哪个级别进行分组，如果是多层索引的情况下。 - `as_index`：指定是否将分组列作为索引，如果为 False，则分组列会作为一般的列出现在结果中。 - `sort`：指定是否按照分组列排序。 - `group_keys`：指定是否在结果中包含分组键。 `groupby` 返回一个 GroupBy 对象，可以对该对象进行各种聚合操作，例如求和、平均值、中位数、最大值、最小值等。常用的聚合函数包括 `sum`、`mean`、`median`、`max`、`min` 等。例如： ```python import pandas as pd data = pd.read_csv('data.csv') grouped = data.groupby('category') result = grouped.mean() ``` 上述代码中，首先读入一个名为 data.csv 的文件，然后按照 category 列进行分组，最后对每个分组计算平均值。

阅读全文