merged.groupby函数
时间: 2023-11-12 16:51:44 浏览: 72
Python DataFrame.groupby()聚合函数,分组级运算
`groupby()` 是 pandas 库中的一个函数,用于对数据进行分组操作。它将数据集按照指定的列或多个列的值进行分组,然后可以对每个分组应用聚合函数。
下面是 `groupby()` 函数的基本语法:
```
grouped = dataframe.groupby(by)
```
其中 `dataframe` 是要分组的数据集,`by` 是用于分组的列名或列名列表。
`groupby()` 函数返回一个 `GroupBy` 对象,你可以对该对象进行聚合操作,如计算平均值、求和、计数等。
以下是一些常见的聚合操作:
- `mean()`:计算分组后每个组的平均值
- `sum()`:计算分组后每个组的总和
- `count()`:计算分组后每个组的数量
- `min()`:计算分组后每个组的最小值
- `max()`:计算分组后每个组的最大值
示例代码:
```python
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
'Age': [25, 30, 35, 25, 30],
'Salary': [50000, 60000, 70000, 50000, 55000]}
df = pd.DataFrame(data)
# 按照 'Name' 列进行分组,并计算平均年龄和总工资
grouped = df.groupby('Name')
result = grouped.agg({'Age': 'mean', 'Salary': 'sum'})
print(result)
```
输出结果:
```
Age Salary
Name
Alice 25.0 100000
Bob 30.0 115000
Charlie 35.0 70000
```
阅读全文