首页pandas中groupby使用方法

pandas中groupby使用方法

时间: 2023-11-12 08:47:56 浏览: 121

3.Pandas应用 GroupBy

测试数据

在pandas中，groupby是一个非常重要的功能，用于对数据进行分组和聚合操作。groupby可以按照某些条件将数据集分成多个组，并对每个组进行相应的操作。使用groupby的基本语法是：`df.groupby(by=grouping_columns)[columns_to_show].function()` 其中： - `by`指定用于分组的列或列的列表。 - `grouping_columns`是要分组的列。 - `columns_to_show`是要显示的列。 - `function()`是要对每个组应用的函数，例如sum、mean、count等。下面是一些常见的groupby使用方法： 1. 按照某一列进行分组并计算该列值的和：`df.groupby('column_name').sum()` 2. 按照多列进行分组并计算多个列的和：`df.groupby(['column1', 'column2']).sum()` 3. 对分组后的结果进行计数：`df.groupby('column_name').size()` 4. 对分组后的结果进行计算多个统计量：`df.groupby('column_name').agg(['sum', 'mean', 'count'])` 5. 对分组后的结果进行自定义计算：`df.groupby('column_name').agg({'column1': 'sum', 'column2': 'mean'})` 还可以使用`apply()`方法在分组后的结果上应用自定义函数。

阅读全文