pandas中groupby使用方法
时间: 2023-11-12 08:47:56 浏览: 121
3.Pandas应用 GroupBy
在pandas中,groupby是一个非常重要的功能,用于对数据进行分组和聚合操作。groupby可以按照某些条件将数据集分成多个组,并对每个组进行相应的操作。
使用groupby的基本语法是:`df.groupby(by=grouping_columns)[columns_to_show].function()`
其中:
- `by`指定用于分组的列或列的列表。
- `grouping_columns`是要分组的列。
- `columns_to_show`是要显示的列。
- `function()`是要对每个组应用的函数,例如sum、mean、count等。
下面是一些常见的groupby使用方法:
1. 按照某一列进行分组并计算该列值的和:`df.groupby('column_name').sum()`
2. 按照多列进行分组并计算多个列的和:`df.groupby(['column1', 'column2']).sum()`
3. 对分组后的结果进行计数:`df.groupby('column_name').size()`
4. 对分组后的结果进行计算多个统计量:`df.groupby('column_name').agg(['sum', 'mean', 'count'])`
5. 对分组后的结果进行自定义计算:`df.groupby('column_name').agg({'column1': 'sum', 'column2': 'mean'})`
还可以使用`apply()`方法在分组后的结果上应用自定义函数。
阅读全文