pandas groupby 多列
时间: 2023-08-17 08:11:38 浏览: 96
pandas apply 函数 实现多进程的示例讲解
pandas的groupby函数可以用于对多个列进行分组操作。你可以使用groupby函数的by参数传入一个列名列表,来指定需要进行分组的多个列。
以下是一个示例代码,演示如何使用pandas的groupby函数对多个列进行分组:
```python
import pandas as pd
# 创建示例数据
data = {
'Category': ['A', 'A', 'B', 'B', 'A'],
'Subcategory': ['X', 'Y', 'X', 'Y', 'X'],
'Value': [1, 2, 3, 4, 5]
}
df = pd.DataFrame(data)
# 使用groupby对多列进行分组
grouped = df.groupby(['Category', 'Subcategory'])
# 对分组后的数据进行聚合操作,例如计算每组的平均值
result = grouped.mean()
print(result)
```
输出结果如下:
```
Value
Category Subcategory
A X 3
Y 2
B X 3
Y 4
```
在上面的示例中,我们首先创建了一个包含三个列的DataFrame。然后,我们使用groupby函数按照'Category'和'Subcategory'两个列进行分组。最后,我们对分组后的数据进行了求均值的聚合操作,并将结果打印出来。
希望这可以帮助到你!如果有任何进一步的问题,请随时提问。
阅读全文