pd的group by 多字段筛选
时间: 2023-07-31 12:10:22 浏览: 128
如果你想使用 Pandas 中的 groupby 函数进行多字段的筛选,可以在 groupby 函数的参数中传入一个列表,列表中包含你要进行分组的多个字段名,例如:
```python
import pandas as pd
df = pd.DataFrame({
'fruit': ['apple', 'banana', 'apple', 'banana', 'orange'],
'color': ['red', 'yellow', 'green', 'yellow', 'orange'],
'price': [1.0, 1.5, 2.0, 2.5, 1.2],
'weight': [100, 120, 80, 90, 110]
})
# 按照 'fruit' 和 'color' 字段进行分组
grouped = df.groupby(['fruit', 'color'])
# 对每个分组计算平均值
result = grouped.mean()
print(result)
```
以上代码中,我们将 DataFrame 按照 'fruit' 和 'color' 字段进行分组,并对每个分组计算平均值。结果如下:
```
price weight
fruit color
apple green 2.0 80.0
red 1.0 100.0
banana yellow 2.0 105.0
orange orange 1.2 110.0
```
注意,多字段分组的结果是一个多级索引的 DataFrame,其中每个级别对应一个分组字段。你可以使用 `.reset_index()` 方法将其转换为标准的 DataFrame。
阅读全文