python dataframe groupby之后shift函数
时间: 2023-10-18 18:02:56 浏览: 132
在 Pandas 中,`groupby` 函数可以把数据按照指定的列进行分组,然后对每个分组进行相应的操作。如果我们需要对每个分组中的某一列进行位移操作,可以使用 `shift` 函数。
例如,假设我们有一个 DataFrame,其中包含了每个城市每天的温度数据,我们想要计算每个城市两天之间的温度变化,可以按照城市进行分组,然后对温度列进行 `shift` 操作,如下所示:
```python
import pandas as pd
# 创建 DataFrame
df = pd.DataFrame({
'city': ['Beijing', 'Beijing', 'Beijing', 'Shanghai', 'Shanghai', 'Shanghai'],
'date': ['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-01', '2020-01-02', '2020-01-03'],
'temperature': [1, 2, 3, 4, 5, 6]
})
# 按照城市分组,并对温度列进行 shift 操作
df['temperature_change'] = df.groupby('city')['temperature'].shift(-1) - df['temperature']
print(df)
```
输出结果如下:
```
city date temperature temperature_change
0 Beijing 2020-01-01 1 1.0
1 Beijing 2020-01-02 2 1.0
2 Beijing 2020-01-03 3 NaN
3 Shanghai 2020-01-01 4 1.0
4 Shanghai 2020-01-02 5 1.0
5 Shanghai 2020-01-03 6 NaN
```
可以看到,我们成功地计算出了每个城市两天之间的温度变化。在这个例子中,我们使用了 `shift(-1)` 对温度列进行位移操作,表示往后移动一行。如果我们想要往前移动一行,可以使用 `shift(1)`。同时,我们还需要对计算出的结果进行命名,这里我们把它命名为 `temperature_change`。
阅读全文