首页df.groupby()函数

df.groupby()函数

时间: 2023-12-15 17:32:55 浏览: 64

`df.groupby()`函数是pandas库中的一个函数，主要用于对数据进行分组和分组后的聚合操作。函数可以根据指定的列对数据进行分组，然后对每个分组进行聚合操作，例如计算每个分组的平均值、总和、最大值、最小值等等。下面是一个示例，假设我们有一个包含学生姓名、科目和成绩的数据集，我们想要按照科目对数据进行分组，并计算每个科目的平均成绩： ```python import pandas as pd # 创建数据集 data = {'Name': ['Tom', 'Jack', 'Tom', 'Jack', 'Tom', 'Jack', 'Tom', 'Tom'], 'Subject': ['Math', 'Math', 'English', 'English', 'Science', 'Science', 'Math', 'Science'], 'Score': [70, 80, 90, 85, 95, 75, 80, 85]} df = pd.DataFrame(data) # 按照科目进行分组，并计算每个科目的平均成绩 grouped = df.groupby('Subject')['Score'].mean() print(grouped) ``` 输出结果为： ``` Subject English 87.5 Math 76.666667 Science 85.0 Name: Score, dtype: float64 ``` 上述代码中，我们首先创建了一个包含学生姓名、科目和成绩的数据集，然后使用`df.groupby()`函数按照科目对数据进行分组，并使用`mean()`函数计算每个科目的平均成绩。

阅读全文