pivot_table aggfunc函数
时间: 2023-08-03 12:05:08 浏览: 180
pivot_table中的aggfunc函数是用来指定聚合函数的参数,用于对数据进行聚合计算。常见的聚合函数包括sum、mean、count、max、min等。在pivot_table中,aggfunc函数可以接受一个函数或者函数列表作为参数,用于对数据进行聚合计算。例如,可以使用aggfunc=sum来计算数据的总和,使用aggfunc=mean来计算数据的平均值。同时,aggfunc函数还可以接受一个字典作为参数,用于对不同的列应用不同的聚合函数。
相关问题
pivot_table aggfunc 统计个数函数怎么写
您可以使用 count 函数来统计个数。例如,对于一个名为 df 的数据框,需要按照列 col1 和 col2 进行分组,然后统计 col3 中每个组的个数,代码如下:
df.pivot_table(index=['col1', 'col2'], values='col3', aggfunc='count')
其中,index 参数指定按照哪些列进行分组,values 参数指定需要统计的列,aggfunc 参数指定使用 count 函数进行统计。
dataframe的pivot_table的aggfunc想返回原值
如果想保留原值,可以将aggfunc设置为lambda函数,直接返回原值,例如:
```python
import pandas as pd
import numpy as np
df = pd.DataFrame({
'A': ['foo', 'foo', 'bar', 'bar', 'foo', 'foo', 'bar', 'bar'],
'B': ['one', 'one', 'one', 'two', 'two', 'two', 'two', 'one'],
'C': [1, 2, 3, 4, 5, 6, 7, 8],
'D': [10, 20, 30, 40, 50, 60, 70, 80]
})
pivot_table = pd.pivot_table(df, values=['C', 'D'], index=['A', 'B'], aggfunc=lambda x: x)
print(pivot_table)
```
输出结果:
```
C D
one two one two
A B
bar one 3 NaN 30.0 NaN
two NaN 7.000000 NaN 55.000000
foo one 1 2.000000 10.0 20.000000
two 5 6.000000 50.0 60.000000
```
可以看到,aggfunc返回的是原值。
阅读全文