pivot_table aggfunc函数
时间: 2023-08-03 15:05:08 浏览: 170
pivot_table中的aggfunc函数是用来指定聚合函数的参数,用于对数据进行聚合计算。常见的聚合函数包括sum、mean、count、max、min等。在pivot_table中,aggfunc函数可以接受一个函数或者函数列表作为参数,用于对数据进行聚合计算。例如,可以使用aggfunc=sum来计算数据的总和,使用aggfunc=mean来计算数据的平均值。同时,aggfunc函数还可以接受一个字典作为参数,用于对不同的列应用不同的聚合函数。
相关问题
pivot_table aggfunc 统计个数函数怎么写
您可以使用 count 函数来统计个数。例如,对于一个名为 df 的数据框,需要按照列 col1 和 col2 进行分组,然后统计 col3 中每个组的个数,代码如下:
df.pivot_table(index=['col1', 'col2'], values='col3', aggfunc='count')
其中,index 参数指定按照哪些列进行分组,values 参数指定需要统计的列,aggfunc 参数指定使用 count 函数进行统计。
dataframe的pivot_table的aggfunc想返回原值
如果想返回原值,可以使用numpy的identity函数作为aggfunc的参数,例如:
```python
import numpy as np
import pandas as pd
df = pd.DataFrame({
'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
'C': np.random.randn(8),
'D': np.random.randn(8)
})
table = pd.pivot_table(df, values=['C', 'D'], index=['A'], columns=['B'], aggfunc=np.identity)
print(table)
```
输出结果为:
```
C D \
B one three two one three two one
A
bar 0.00 0.000000 0.000000 -0.183689 -1.505717 -1.828454 -0.423514
foo 1.31 0.000000 0.223218 -0.999874 0.000000 1.089636 -0.723494
B three two
A
bar -0.394190 -0.296186
foo 0.270786 -1.251657
```
可以看到,aggfunc返回的值就是原始值,因为identity函数会返回输入的值本身。
阅读全文