pandas使用groupby分组之后统计每组中符合要求的数据
时间: 2024-05-03 13:19:21 浏览: 146
详解python pandas 分组统计的方法
5星 · 资源好评率100%
可以使用 `groupby` 方法对数据进行分组,然后使用 `apply` 方法对每组数据进行统计。
例如,假设有一个数据集 `df`,其中包含三列数据:`group`、`value1` 和 `value2`。我们要对 `group` 列进行分组,然后统计每组中 `value1` 大于 10 且 `value2` 小于 5 的数据个数,可以按如下方式实现:
``` python
import pandas as pd
# 创建数据集
data = {'group': ['A', 'A', 'B', 'B', 'C', 'C'],
'value1': [12, 3, 5, 8, 15, 20],
'value2': [3, 4, 2, 7, 1, 9]}
df = pd.DataFrame(data)
# 分组并统计每组符合条件的数据个数
result = df.groupby('group').apply(lambda x: ((x['value1'] > 10) & (x['value2'] < 5)).sum())
print(result)
```
输出结果为:
```
group
A 1
B 0
C 1
dtype: int64
```
说明在 A 组和 C 组中,有一个符合条件的数据。
阅读全文