现有奶茶店数据,有下单时间,时间跨度为5个月,奶茶开始制作时间,奶茶制作完成时间,一单中的杯量,门店编号,需要填充每个门店当天的开始制作时间和制作完成时间的缺失值,写出Python代码
时间: 2024-03-27 21:40:43 浏览: 129
可以使用Pandas库进行数据处理,以下是填充缺失值的Python代码:
```python
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 将时间字符串转换为时间格式
data['下单时间'] = pd.to_datetime(data['下单时间'])
data['奶茶开始制作时间'] = pd.to_datetime(data['奶茶开始制作时间'])
data['奶茶制作完成时间'] = pd.to_datetime(data['奶茶制作完成时间'])
# 按门店和下单日期进行分组
data['下单日期'] = data['下单时间'].dt.date
data['奶茶开始制作日期'] = data['奶茶开始制作时间'].dt.date
data['奶茶制作完成日期'] = data['奶茶制作完成时间'].dt.date
grouped = data.groupby(['门店编号', '下单日期'])
# 填充缺失值
data['奶茶开始制作时间'] = grouped['奶茶开始制作时间'].ffill().bfill()
data['奶茶制作完成时间'] = grouped['奶茶制作完成时间'].ffill().bfill()
# 输出结果
print(data)
```
其中,`to_datetime()`函数将时间字符串转换为时间格式,`dt.date`属性获取日期。在按门店和下单日期进行分组后,对每一组进行填充缺失值操作即可。由于时间跨度比较大,可能需要较长的运行时间。
阅读全文