首页pandas的groupby分组用法

pandas的groupby分组用法

时间: 2023-08-31 12:11:01 浏览: 130

pandas的groupby方法是用于对数据进行分组操作的常用函数。它可以将数据按照指定的列或者条件进行分组，并对每个分组进行相应的聚合计算。下面是groupby方法的基本用法示例： ```python import pandas as pd # 创建一个DataFrame data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'], 'Age': [25, 30, 35, 25, 30], 'City': ['New York', 'Los Angeles', 'San Francisco', 'New York', 'Los Angeles'], 'Salary': [50000, 60000, 70000, 55000, 65000]} df = pd.DataFrame(data) # 按照Name列进行分组 grouped = df.groupby('Name') # 对每个分组进行聚合计算，例如计算平均工资 average_salary = grouped['Salary'].mean() print(average_salary) ``` 运行以上代码，会输出按照Name列分组后，每个分组的平均工资： ``` Name Alice 52500 Bob 62500 Charlie 70000 Name: Salary, dtype: int64 ``` 除了使用单一的列名进行分组，还可以使用多个列名进行分组，例如`groupby(['Name', 'City'])`。在groupby方法中，还可以进行各种其他的聚合操作，例如求和、计数、最大值、最小值等。可以通过调用相应的聚合函数实现，例如`.sum()`、`.count()`、`.max()`、`.min()`等。此外，还可以使用自定义的聚合函数，通过`.agg()`方法来实现。希望以上内容对你有帮助，如果还有其他问题，请随时提问！

阅读全文