pivot_table()透视表
时间: 2024-04-17 14:23:28 浏览: 73
Pandas透视表(pivot_table)详解
5星 · 资源好评率100%
pivot_table() 是 pandas 库中的一个函数,用于创建透视表。透视表是一种交互式报表,可以对原始数据进行汇总和分析,以便更好地理解数据的分布和关系。
pivot_table() 函数的常用参数如下:
- values:需要汇总的列或列的列表。
- index:用于分组的列或列的列表。
- columns:用于分组的列或列的列表,用于创建列名或多层列索引。
- aggfunc:用于聚合的函数,如 sum、mean、count、max、min 等。
- fill_value:用于替换汇总表中的空值(NaN)。
- margins:添加行和列的汇总统计信息,可选参数为 True 和 False。
示例:
```python
import pandas as pd
data = {'City': ['Beijing', 'Beijing', 'Shanghai', 'Shanghai', 'Guangzhou', 'Guangzhou'],
'Year': [2019, 2020, 2019, 2020, 2019, 2020],
'Population': [2154, 2171, 2424, 2419, 1441, 1462],
'GDP': [30320, 30500, 35000, 36000, 20300, 21000]}
df = pd.DataFrame(data)
# 创建透视表
pt = pd.pivot_table(df, values=['Population', 'GDP'], index='City', columns='Year', aggfunc=sum, fill_value=0, margins=True)
print(pt)
```
输出结果:
```
GDP Population
Year 2019 2020 All 2019 2020 All
City
Beijing 30320 30500 60820 2154 2171 4325
Guangzhou 20300 21000 41300 1441 1462 2903
Shanghai 35000 36000 71000 2424 2419 4843
All 85620 87500 173120 6019 6052 12071
```
该透视表按照城市和年份对数据进行了分组,以 GDP 和 Population 为值进行汇总,填充空值为0,并添加了行和列的汇总统计信息。
阅读全文