pandas聚合函数计数
时间: 2023-10-20 10:06:09 浏览: 39
在pandas中,可以使用聚合函数`count()`来计算某个列或者整个DataFrame中的非缺失值的数量。
如果你想计算某个列中非缺失值的数量,可以使用如下语法:
```python
df['列名'].count()
```
如果你想计算整个DataFrame中非缺失值的数量,可以使用如下语法:
```python
df.count()
```
这两种方法都会返回非缺失值的数量。注意,缺失值会被忽略计数。
希望对你有帮助!如果你有更多问题,请继续提问。
相关问题
pandas分组函数用法
pandas中的分组函数是groupby()函数,它可以将数据按照指定的列或多个列进行分组。使用groupby()函数可以实现对数据的分组统计和聚合操作。首先,你可以使用groupby()函数按照某一列或多个列对数据进行分组。然后,你可以对分组后的数据进行各种统计和聚合操作,如计数、求和、平均值等。最后,你可以使用agg()函数对不同列应用不同的聚合函数。
pandas分组聚合
Pandas中的分组聚合是一种常用的数据处理操作,用于基于某些特征将数据集拆分成不同的组,并对每个组应用聚合函数来计算汇总统计量。下面是一个简单的示例:
假设我们有一个包含"姓名"、"性别"和"年龄"的数据集,我们想要按照性别进行分组,并计算每个组的平均年龄和人数。
首先,我们导入pandas库并读取数据集:
``` python
import pandas as pd
data = {
'姓名': ['张三', '李四', '王五', '赵六', '小明', '小红'],
'性别': ['男', '男', '女', '男', '女', '女'],
'年龄': [25, 30, 27, 29, 32, 28]
}
df = pd.DataFrame(data)
```
然后,我们使用`groupby`方法根据"性别"进行分组,并应用聚合函数:
``` python
grouped_df = df.groupby('性别').agg({'年龄': ['mean', 'count']})
```
最后,我们可以打印出结果:
``` python
print(grouped_df)
```
输出:
```
年龄
mean count
性别
女 28.3 3
男 28.0 3
```
在这个示例中,我们首先使用`groupby`方法根据"性别"将数据集分成两组,然后使用`agg`方法计算每个组的平均年龄和人数。
除了平均值和计数之外,Pandas还提供了多种其他的聚合函数,如求和、最大值、最小值、中位数等。你可以根据需求选择适合的聚合函数来进行分组聚合操作。