pd.groupby()apply
时间: 2023-10-13 14:16:07 浏览: 85
`pd.groupby().apply()`方法是Pandas中的一个功能强大的组合方法,它可以在一个分组对象上应用一个函数,然后将结果组合成一个新的DataFrame或Series。
具体来说,`pd.groupby()`方法可以用来将DataFrame按照某几列的值进行分组。然后,我们可以使用`apply()`方法将一个函数应用于每个分组,并将结果组合成一个新的DataFrame或Series。
例如,假设我们有一个包含订单信息的DataFrame,我们可以将其按照客户ID进行分组,然后对每个分组应用一个函数,例如计算每个客户的订单总量:
```
import pandas as pd
orders = pd.DataFrame({
'customer_id': ['A', 'A', 'B', 'B', 'B', 'C'],
'order_amount': [100, 50, 200, 150, 75, 300]
})
# 按照客户ID分组,并计算订单总量
order_totals = orders.groupby('customer_id').apply(lambda x: x['order_amount'].sum())
print(order_totals)
```
这将输出:
```
customer_id
A 150
B 425
C 300
dtype: int64
```
这里,我们首先使用`groupby()`方法将订单DataFrame按照客户ID进行分组。然后,我们使用`apply()`方法将一个lambda函数应用于每个分组,该函数计算每个客户的订单总量。最后,`apply()`方法返回的结果是一个新的Series,其中包含每个客户的订单总量。
阅读全文