python操作csv(有Date、TotalPrice两列数据)数据表,数据表第一行为表头信息:python调用shuju.csv表,将A27赋值为2023/02、给B27赋值为2694543.0,然后根据shuju.csv表构建一个lstm预测模型(可以根据Date预测TotalPrice的值),该模型可以求出预测值totalprice=y_test_pred,然后将求出的totalprice值赋值给B26和B28;下一步接着将A28赋值2023/03,调用lstm预测模型,将最新的totalprice值赋值给B27和B29;一直进行循环直到Date的值到2024/12。
时间: 2023-12-03 09:46:51 浏览: 81
python处理csv数据的方法
3星 · 编辑精心推荐
以下是实现上述任务的Python代码:
```python
import csv
import numpy as np
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from keras.models import Sequential
from keras.layers import LSTM, Dense
# 读取csv文件
data = pd.read_csv('shuju.csv')
# 将Date列转换为时间格式
data['Date'] = pd.to_datetime(data['Date'], format='%Y/%m')
# 设置预测起始日期和结束日期
start_date = pd.to_datetime('2023/02', format='%Y/%m')
end_date = pd.to_datetime('2024/12', format='%Y/%m')
# 筛选出预测起始日期之后的数据
data = data[data['Date'] >= start_date]
# 将数据归一化
scaler = MinMaxScaler(feature_range=(0, 1))
data_scaled = scaler.fit_transform(data[['TotalPrice']])
# 定义函数,将数据转换为LSTM模型的输入格式
def create_dataset(X, y, time_steps=1):
Xs, ys = [], []
for i in range(len(X) - time_steps):
Xs.append(X[i:(i + time_steps)])
ys.append(y[i + time_steps])
return np.array(Xs), np.array(ys)
# 构建LSTM模型
TIME_STEPS = 12
model = Sequential()
model.add(LSTM(128, input_shape=(TIME_STEPS, 1)))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')
# 训练LSTM模型
X_train, y_train = create_dataset(data_scaled, data_scaled, TIME_STEPS)
model.fit(X_train, y_train, epochs=50, batch_size=16, verbose=2)
# 初始化预测起始日期和结束日期
pred_date = start_date
pred_dates = []
total_prices = []
# 循环预测每个月的TotalPrice值
while pred_date <= end_date:
# 构造预测数据
pred_data = data[data['Date'] < pred_date].tail(TIME_STEPS)
pred_data_scaled = scaler.transform(pred_data[['TotalPrice']])
X_pred = np.array(pred_data_scaled.reshape(1, TIME_STEPS, 1))
# 进行预测
y_pred = model.predict(X_pred)
# 将预测结果反归一化
y_pred = scaler.inverse_transform(y_pred)[0][0]
# 将预测结果存储
pred_dates.append(pred_date)
total_prices.append(y_pred)
# 更新日期
pred_date = pred_date + pd.DateOffset(months=1)
# 将预测结果存入csv文件
with open('shuju.csv', 'a', newline='') as f:
writer = csv.writer(f)
for i in range(len(pred_dates)):
writer.writerow([pred_dates[i].strftime('%Y/%m'), '', total_prices[i]])
# 更新原始数据中的TotalPrice列
data = pd.read_csv('shuju.csv')
data['TotalPrice'] = np.where(data['TotalPrice'].isnull(), data['TotalPrice'].shift(1), data['TotalPrice'])
data.to_csv('shuju.csv', index=False)
# 更新A27、B26、B27、B28、B29的值
data.loc[data['Date'] == pd.to_datetime('2023/02', format='%Y/%m'), 'TotalPrice'] = 2694543.0
data.loc[data['Date'] == pd.to_datetime('2023/03', format='%Y/%m'), 'TotalPrice'] = total_prices[1]
data.loc[data['Date'] == pd.to_datetime('2024/12', format='%Y/%m'), 'TotalPrice'] = total_prices[-1]
data.to_csv('shuju.csv', index=False)
```
需要注意的是,上述代码假设原始数据中Date列的格式为YYYY/MM,如果实际格式不同,需要相应地修改代码中的日期格式字符串。此外,由于LSTM模型的训练结果会受到随机因素的影响,因此每次运行代码得到的预测结果可能会有所不同。
阅读全文