dataframe pivot
时间: 2023-07-06 15:38:12 浏览: 93
Python 借助DataFrame的pivot进行数据的可视化
DataFrame.pivot()是 Pandas 库中的一个方法,用于对数据进行透视操作,将数据按照指定的行和列进行分组,并对指定的数值进行聚合操作,生成新的表格。pivot() 方法的语法如下:
```python
DataFrame.pivot(index=None, columns=None, values=None)
```
其中,参数 index 和 columns 分别指定透视表的行和列,可以是单个列名或列名的列表,也可以是包含多个列名的元组;参数 values 指定需要进行聚合操作的列名,可以省略,此时将对所有的数值列进行聚合操作。
下面是一个 pivot() 方法的示例:
```python
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
'gender': ['F', 'M', 'M', 'M', 'F'],
'age': [25, 30, 35, 40, 45],
'salary': [5000, 6000, 7000, 8000, 9000]
}
df = pd.DataFrame(data)
print(df)
# 透视表,行为 gender,列为 age,聚合值为 salary
pivot_df = df.pivot(index='gender', columns='age', values='salary')
print(pivot_df)
```
运行结果如下:
```
name gender age salary
0 Alice F 25 5000
1 Bob M 30 6000
2 Charlie M 35 7000
3 David M 40 8000
4 Emma F 45 9000
age 25 30 35 40 45
gender
F 5000.0 NaN NaN NaN 9000.0
M NaN 6000.0 7000.0 8000.0 NaN
```
可以看到,透视表将原始表格按照 gender 分为两组,按照 age 分为五组,然后对 salary 进行了聚合操作,生成了一个新的表格。
阅读全文