我现在有这样一个训练数据它提供了2015 年 9 月 1 日至 2018 年 12 月 20 日的数据，其存储在（order_train1.csv）文件中，包含以下信息（提供一个样例） order_date（订单日期）:2015/9/1； sales_region_code（销售区域编码）：104； item_code（产品编码）：22069； ord_qty （订单需求量）：19；现在要用python代码对未来三个月的数据进行预测。可以给python代码吗？然后，将结果保存在（predict_sku1.csv）文件中，其格式为： sales_region_co de：101； item_code：20002； 2019 年 1 月预测需求量：1； 2019 年 2 月预测需求量：3； 2019 年 3 月预测需求量：2；

时间: 2023-06-05 21:05:54 浏览: 68

可以，你可以使用Python的pandas和sklearn库来完成数据读取和预测。首先，使用pandas读取order_train1.csv文件，并对数据进行处理，使之符合sklearn模型的要求，代码如下： ```python import pandas as pd # 读取csv文件 data = pd.read_csv('order_train1.csv') # 选取需要的列 data = data[['sales_region_code', 'item_code', 'ord_qty', 'order_date']] # 转换时间格式 data['order_date'] = pd.to_datetime(data['order_date']) # 提取年份和月份 data['year'] = data['order_date'].dt.year data['month'] = data['order_date'].dt.month # 将销售区域编码和产品编码转换为类别型数据 data['sales_region_code'] = data['sales_region_code'].astype('category') data['item_code'] = data['item_code'].astype('category') # 将数据按年份和月份升序排列 data.sort_values(['year', 'month'], inplace=True) # 删除时间列 data.drop(['order_date'], axis=1, inplace=True) # 对目标特征进行处理 y = data.pop('ord_qty') ``` 接下来，使用sklearn库训练预测模型，并对未来三个月的需求量进行预测，代码如下： ```python from sklearn.ensemble import RandomForestRegressor # 训练模型 model = RandomForestRegressor(n_estimators=100, random_state=42) model.fit(data, y) # 构建需要预测的DataFrame predictions = pd.DataFrame({ 'sales_region_code': [101], 'item_code': [20002], 'year': [2019], 'month': [1, 2, 3] }) # 进行预测 results = model.predict(predictions) # 将预测结果保存到csv文件 results_df = pd.DataFrame(results, columns=['2019年1月预测需求量', '2019年2月预测需求量', '2019年3月预测需求量']) results_df.to_csv('predict_sku1.csv') ``` 上述代码中，我们使用了随机森林回归模型进行预测，预测结果保存到predict_sku1.csv文件中。

相关推荐

getdata-015:Coursera的课程项目-获取和清洁数据，2015年6月1日至6月28日

Getting-Cleaning-Data-Course-Project:获取和清理数据课程项目 2015 年 4 月 26 日

getdata:用于获取和清理数据的 Github 存储库，2015 年 1 月

请在matlab上用深度学习模型帮我做一组包含12个数据的数据集未来3个数据预测的代码

我现在有图像数据要做二分类，帮我用pytorch划分训练和验证集并自定义数据集训练

如何标记一个训练数据集

一款物品识别app，经过海量数据训练模型，它在断网情况下能正常识别吗

我想用pd.dataframe存储多种训练数据

我不想训练cifar-10这个数据集，我想训练我自己的数据集D:\wjd\tpfl在这个路径下

我有一个来自十个类别各100个共1000个的信号数据，每个数据有512个特征点，存储为一个(1000,1,512)的torch.tensor张量，现在我想将其输入一个深度BP网络训练分类模型用于分类这些类别，请使用pytorch实现

怎么样使训练和验证数据为9比1

如果我训练一个神经网络，是不是需要把输入输出的数据都存放在字典里，如果出现了字典中不存在的数据，会发生什么情况

我现在有一批数据，你能用上面的例子进行预测吗

对天气网站进行爬虫1个月的数据，晴天，下雨，多云，使用某个算法

matlab.随机选取12个维度的数据中的80%作为训练输入数据，其余20%作为测试输入数据 ,利用训练输入数据与KNN算法对分类模型进行训练

我有一个来自十个类别各100个共1000个的信号数据，每个数据有512个特征点，存储为一个(1000,1,,512)的torch.tensor张量，现在我想将其输入一个深度NNLM网络训练分类模型用于分类这些类别，请使用pytorch实现

代码：有训练集csv和预测集csv，训练集中有日期列“年/月/日”，预测集中没有日期列，用BP神经网络进行对未来三个月的时间序列预测，将结果保存在excel中

编写pytorch代码，读取训练集，将训练集的第一列年月日转换为标准的时间戳字符串，替换原有的数据

最新推荐

QT5开发及实例配套源代码.zip

grpcio-1.46.3-cp37-cp37m-musllinux_1_1_i686.whl

zigbee-cluster-library-specification

管理建模和仿真的文件

MATLAB柱状图在信号处理中的应用：可视化信号特征和频谱分析

用Spring boot和vue写一个登录注册界面

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

MATLAB柱状图在数据分析中的作用：从可视化到洞察

命名ACL和拓展ACL标准ACL的具体区别