Pandas库中的groupby() 详解
时间: 2024-10-21 07:02:57 浏览: 37
Python的pandas库+CSV文件处理详细使用,以及与一般Python处理操作对比
5星 · 资源好评率100%
在Pandas库中,`groupby()`是一个强大的功能,用于根据一或多个列的值对DataFrame进行分组,并对每个组应用特定的统计操作。其基本语法如下:
```python
df.groupby(key_column(s)).function(column(s))
```
这里,`key_column(s)`是你想要依据其划分数据的列名,而`function(column(s))`则是在每个组内你想执行的操作,比如`sum()`、`mean()`、`count()`、`min()`、`max()`等,也可以使用`.apply()`进行自定义函数的处理。
这个函数返回一个GroupBy对象,它包含了所有分组后的信息。你可以直接查看分组的结果,或者继续进行其他操作。
举个例子:
```python
import pandas as pd
# 假设我们有一个包含订单数据的DataFrame
data = {
'Customer': ['A', 'B', 'A', 'C', 'B', 'B'],
'Product': ['X', 'Y', 'Y', 'X', 'Z', 'Z'],
'Price': [10, 20, 30, 40, 50, 60]
}
df = pd.DataFrame(data)
# 按照顾客分组并计算每个客户的总花费
grouped = df.groupby('Customer')['Price'].sum()
print(grouped)
```
这将输出每个客户的总花费。
阅读全文