pandas的groupby分组用法
时间: 2023-08-31 12:11:01 浏览: 130
pandas的groupby方法是用于对数据进行分组操作的常用函数。它可以将数据按照指定的列或者条件进行分组,并对每个分组进行相应的聚合计算。
下面是groupby方法的基本用法示例:
```python
import pandas as pd
# 创建一个DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
'Age': [25, 30, 35, 25, 30],
'City': ['New York', 'Los Angeles', 'San Francisco', 'New York', 'Los Angeles'],
'Salary': [50000, 60000, 70000, 55000, 65000]}
df = pd.DataFrame(data)
# 按照Name列进行分组
grouped = df.groupby('Name')
# 对每个分组进行聚合计算,例如计算平均工资
average_salary = grouped['Salary'].mean()
print(average_salary)
```
运行以上代码,会输出按照Name列分组后,每个分组的平均工资:
```
Name
Alice 52500
Bob 62500
Charlie 70000
Name: Salary, dtype: int64
```
除了使用单一的列名进行分组,还可以使用多个列名进行分组,例如`groupby(['Name', 'City'])`。
在groupby方法中,还可以进行各种其他的聚合操作,例如求和、计数、最大值、最小值等。可以通过调用相应的聚合函数实现,例如`.sum()`、`.count()`、`.max()`、`.min()`等。此外,还可以使用自定义的聚合函数,通过`.agg()`方法来实现。
希望以上内容对你有帮助,如果还有其他问题,请随时提问!
阅读全文