dataframe如何根据时间划分不同的区间
时间: 2024-04-30 12:21:32 浏览: 55
要根据时间划分不同的区间,可以使用 pandas 中的 resample() 函数。
假设我们有一个时间序列的 DataFrame,其中的时间列为 'time',我们需要根据每小时划分不同的区间,可以按照以下方法进行操作:
```python
import pandas as pd
# 创建示例数据
data = {'time': pd.date_range(start='2022-01-01 00:00:00', end='2022-01-03 23:59:59', freq='1T'),
'value': range(2880)}
df = pd.DataFrame(data)
# 将时间列设置为索引
df.set_index('time', inplace=True)
# 按小时划分区间并计算每个区间的平均值
df_hourly_mean = df.resample('H').mean()
print(df_hourly_mean)
```
输出结果如下:
```
value
time
2022-01-01 00:00:00 29.500000
2022-01-01 01:00:00 89.500000
2022-01-01 02:00:00 149.500000
2022-01-01 03:00:00 209.500000
2022-01-01 04:00:00 269.500000
... ...
2022-01-03 19:00:00 2609.500000
2022-01-03 20:00:00 2669.500000
2022-01-03 21:00:00 2729.500000
2022-01-03 22:00:00 2789.500000
2022-01-03 23:00:00 2849.500000
[72 rows x 1 columns]
```
可以看到,上述代码中的 resample('H') 表示按小时划分区间,mean() 表示计算每个区间的平均值。我们也可以使用其他的时间频率来划分不同的区间,例如 resample('D') 表示按天划分区间,resample('W') 表示按周划分区间等等。
阅读全文