pandas.groupby
时间: 2023-08-31 22:05:27 浏览: 102
3.Pandas应用 GroupBy
pandas.groupby 是 pandas 库中的一个方法,用于按照一列或多列的值对数据进行分组。通过指定分组依据,可以将数据拆分为多个组,并进行聚合、转换或其他操作。这个方法可以用于处理数据集中的统计、分析、汇总等需求。
例如,可以使用 `groupby` 方法按照某一列的值对数据进行分组,然后使用聚合函数(如求和、求平均值等)对每个组进行计算。另外,还可以对每个组应用其他自定义的函数进行处理。
以下是一个示例代码,演示了如何使用 `groupby` 方法进行分组和聚合操作:
```python
import pandas as pd
# 创建示例数据
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
'Age': [25, 30, 35, 40, 45],
'Salary': [5000, 6000, 7000, 8000, 9000]}
df = pd.DataFrame(data)
# 按照 'Name' 列进行分组,并计算每个组的平均工资
grouped = df.groupby('Name')
average_salary = grouped['Salary'].mean()
print(average_salary)
```
输出结果为:
```
Name
Alice 6500
Bob 7500
Charlie 7000
Name: Salary, dtype: int64
```
以上代码将数据按照 'Name' 列的值分成了三个组,并计算了每个组的平均工资。
阅读全文