首页dataframe怎么做groupby

dataframe怎么做groupby

时间: 2023-08-15 08:07:46 浏览: 90

在 pandas 中，你可以使用 `groupby()` 函数对 DataFrame 进行分组操作。`groupby()` 函数将数据按照指定的列或多个列进行分组，然后可以对每个组应用聚合函数或其他操作。以下是使用 `groupby()` 函数的基本用法： ```python import pandas as pd # 创建示例数据框 data = { 'Category': ['A', 'A', 'B', 'B', 'A', 'B'], 'Value': [1, 2, 3, 4, 5, 6] } df = pd.DataFrame(data) # 对 Category 列进行分组，并计算每个组的平均值 grouped_df = df.groupby('Category').mean() print(grouped_df) ``` 运行这段代码会输出以下结果： ``` Value Category A 2.67 B 4.33 ``` 在上述代码中，我们首先创建了一个示例数据框 `df`，其中包含两列 Category 和 Value。然后，我们使用 `groupby()` 函数按照 Category 列进行分组。最后，我们对每个组应用了 `mean()` 聚合函数，计算出每个组的平均值，并打印出结果。你也可以使用多个列进行分组，只需在 `groupby()` 函数中传入一个包含多个列名的列表即可。例如： ```python grouped_df = df.groupby(['Category', 'Subcategory']).sum() ``` 这样会按照 Category 和 Subcategory 列进行分组，并计算每个组的总和。除了聚合函数，`groupby()` 还支持其他操作，如 `count()`、`sum()`、`min()`、`max()` 等。你可以根据需要选择适合的操作来处理分组后的数据。更多关于 `groupby()` 函数的详细用法和参数说明，你可以查阅 pandas 官方文档。

阅读全文