首页29.pandas如何实现SQL的group by

29.pandas如何实现SQL的group by

时间: 2023-06-24 07:08:21 浏览: 91

在pandas中，可以使用`groupby()`函数来实现SQL中的`GROUP BY`操作。`groupby()`函数将数据按照指定的列进行分组，并对每组数据进行聚合操作。例如，假设我们有一个数据集`df`，包含姓名、性别和年龄三列数据，我们想要按照性别对年龄进行分组统计平均值，可以使用以下代码： ```python import pandas as pd # 创建数据集 data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily', 'Frank'], 'gender': ['F', 'M', 'M', 'M', 'F', 'M'], 'age': [25, 30, 35, 40, 45, 50]} df = pd.DataFrame(data) # 按性别分组计算平均年龄 result = df.groupby('gender')['age'].mean() print(result) ``` 执行以上代码，我们得到的结果是： ``` gender F 35.0 M 38.333333 Name: age, dtype: float64 ``` 其中，`gender`列作为分组的依据，`age`列作为需要聚合的列，`mean()`函数表示计算平均值。除了`mean()`函数，还可以使用其他的聚合函数，例如`sum()`、`count()`、`max()`、`min()`等，具体使用方法与SQL中类似。