给出一组出租车订单数据集并用resample函数将该组数据按照时间重采样
时间: 2024-03-03 13:47:18 浏览: 116
pandas的resample重采样的使用
5星 · 资源好评率100%
假设我们有一个出租车订单的数据集 `taxi_data`,其中包含订单的时间戳(`pickup_datetime`)和订单的时长(`trip_duration`)等信息。我们可以使用 Pandas 库中的 `resample` 函数对该组数据进行时间重采样,如下所示:
```python
import pandas as pd
# 读取数据集
taxi_data = pd.read_csv('taxi_data.csv')
# 将 pickup_datetime 字段设为索引
taxi_data = taxi_data.set_index('pickup_datetime')
# 将时序数据按照每小时进行重采样,并计算每小时订单的平均时长
resampled_data = taxi_data.resample('H').mean()
# 输出重采样后的数据
print(resampled_data)
```
上述代码中,首先读取了出租车订单的数据集,并将 `pickup_datetime` 字段设为索引;然后使用 `resample` 函数将该组数据按照每小时进行重采样,并计算每小时订单的平均时长;最后输出重采样后的数据。
阅读全文