怎么修改以上代码,使得缺失值用每个Pickup_Zone到每个Dropoff_Zone的平均值填写
时间: 2024-03-27 21:34:57 浏览: 53
均值、0、和随机森林来填补缺失值
你可以使用`transform()`函数将每个分组的平均值应用于该分组中的所有元素。代码如下:
```
grouped_Travel_time = Order_df.groupby(['Arrive_step', 'Pickup_Zone', 'Dropoff_Zone'])['Travel_time'].transform(lambda x: x.fillna(x.mean()))
```
这段代码的作用是,在`Order_df`数据框中按照`Arrive_step`、`Pickup_Zone`和`Dropoff_Zone`三个列进行分组,并对每个分组中的`Travel_time`列进行缺失值填充。填充方式为,使用该分组中所有非缺失值的平均值进行填充。最终,得到一个以`Travel_time`为值的Series对象`grouped_Travel_time`。
阅读全文