python中的unstack()函数
时间: 2024-09-06 15:08:01 浏览: 89
Python中的`unstack()`函数通常是pandas库中的一部分,它用于将DataFrame的层次化索引(也称为多重索引)进行重塑。具体来说,`unstack()`方法会将一个列索引转化为行索引,这样可以改变DataFrame的形状,使得原本在列索引层的数据转移到行索引层。这个操作通常用于处理pandas库操作中得到的堆叠(stacked)数据。
使用`unstack()`方法后,内层的列索引会变成外层的行索引,从而减少数据的嵌套层级。这是一个非常有用的工具,特别是在处理时间序列数据或进行数据重塑时。值得注意的是,`unstack()`方法会默认保留缺失值,也就是说,如果数据在转换过程中有缺失,那么结果中会以NaN(Not a Number)表示。
下面是一个简单的例子来展示`unstack()`方法的使用:
```python
import pandas as pd
# 创建一个简单的DataFrame
df = pd.DataFrame({
'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix'],
'2015': [8405837, 3971078, 2716951, 2239558, 1563025],
'2016': [8537673, 3990458, 2714856, 2278194, 1615017]
})
# 设置多重索引
df = df.set_index(['City', df.columns[1:]])
print(df)
# 使用unstack()方法重塑数据
df_unstacked = df.unstack(level=1)
print(df_unstacked)
```
在这个例子中,我们首先创建了一个包含城市和两年人口数据的DataFrame。然后,我们设置了一个多重索引,其中城市名是第一层索引,而年份是第二层索引。通过`unstack()`方法,我们将年份这一层索引移动到行索引,从而得到了一个新的DataFrame,其中年份成为了列。
阅读全文