dataframe怎么做groupby
时间: 2023-08-15 16:07:46 浏览: 84
对DataFrame数据中的重复行,利用groupby累加合并的方法详解
5星 · 资源好评率100%
在 pandas 中,你可以使用 `groupby()` 函数对 DataFrame 进行分组操作。`groupby()` 函数将数据按照指定的列或多个列进行分组,然后可以对每个组应用聚合函数或其他操作。
以下是使用 `groupby()` 函数的基本用法:
```python
import pandas as pd
# 创建示例数据框
data = {
'Category': ['A', 'A', 'B', 'B', 'A', 'B'],
'Value': [1, 2, 3, 4, 5, 6]
}
df = pd.DataFrame(data)
# 对 Category 列进行分组,并计算每个组的平均值
grouped_df = df.groupby('Category').mean()
print(grouped_df)
```
运行这段代码会输出以下结果:
```
Value
Category
A 2.67
B 4.33
```
在上述代码中,我们首先创建了一个示例数据框 `df`,其中包含两列 Category 和 Value。然后,我们使用 `groupby()` 函数按照 Category 列进行分组。最后,我们对每个组应用了 `mean()` 聚合函数,计算出每个组的平均值,并打印出结果。
你也可以使用多个列进行分组,只需在 `groupby()` 函数中传入一个包含多个列名的列表即可。例如:
```python
grouped_df = df.groupby(['Category', 'Subcategory']).sum()
```
这样会按照 Category 和 Subcategory 列进行分组,并计算每个组的总和。
除了聚合函数,`groupby()` 还支持其他操作,如 `count()`、`sum()`、`min()`、`max()` 等。你可以根据需要选择适合的操作来处理分组后的数据。更多关于 `groupby()` 函数的详细用法和参数说明,你可以查阅 pandas 官方文档。
阅读全文