pivot——table
时间: 2023-07-31 14:10:03 浏览: 128
`pivot_table`是pandas中用于创建透视表的函数,它可以根据一个或多个键对数据进行分组,并且可以对分组后的数据进行聚合计算。pivot_table的语法如下:
```python
DataFrame.pivot_table(values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True)
```
参数说明:
- `values`:可选,要汇总的列,默认为所有数值型列。
- `index`:可选,行分组列。
- `columns`:可选,列分组列。
- `aggfunc`:可选,对数据进行聚合计算的函数,默认为平均值。
- `fill_value`:可选,用于替换缺失值的值。
- `margins`:可选,添加行/列总计,默认为False。
- `dropna`:可选,是否删除含有缺失值的行/列,默认为True。
下面是一个例子:
```python
import pandas as pd
import numpy as np
# 创建一个示例DataFrame
df = pd.DataFrame({'A': ['foo', 'foo', 'bar', 'bar', 'foo', 'foo'],
'B': ['one', 'two', 'one', 'two', 'one', 'two'],
'C': np.random.randn(6),
'D': np.random.randn(6)})
# 使用pivot_table函数创建透视表
table = pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'], aggfunc=np.sum)
print(table)
```
上述代码将创建一个DataFrame,并使用pivot_table函数创建一个透视表。透视表将按照'A'和'B'列进行分组,并且对'D'列的值进行求和计算。'C'列的值将用作列索引。输出的结果将是一个新的DataFrame,其中行是'A'和'B'列的组合,列是'C'列的不同值,单元格中的值是'D'列的聚合值。
阅读全文