def machine_study_forecast(df): df1=clean_date(df) middle_time = pd.to_datetime('2014-12-14') df1['date'] = pd.to_datetime(df1['date']) df2 = df1[df1['date'] > middle_time] df3 = df1[df1['date'] <= middle_time] df_train=pd.get_dummies(df3['behavior_type'],prefix='behavior_type') print(df_train) y=df_train.behavior_type_4.values y = y.reshape(-1, 1) x=df_train.drop(columns=['behavior_type_4']) x=pd.concat([df3,x],axis=1) x=x.drop(columns=['behavior_type']) print(x) print(y) x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=0) ann = Sequential() # 创建一个序贯ANN(Artifical Neural Network)模型 ann.add(Dense(units=8, input_dim=8, activation='relu')) # 添加输入层 ann.add(Dense(units=16, activation='relu')) # 添加隐层 ann.add(Dense(units=1, activation='sigmoid')) # 添加输出层 ann.summary() # 显示网络模型(这个语句不是必须的) # SVG(model_to_dot(ann, show_shapes=True).create(prog='dot', format='svg')) ann.compile(optimizer='adam', # 优化器 loss='binary_crossentropy', # 损失函数 metrics=['acc']) # 评估指标 history = ann.fit(x_train, y_train, # 指定训练集 epochs=30, # 指定训练的轮次 batch_size=64, # 指定数据批量 validation_data=(x_test, y_test)) # 指定验证集,这里为了简化模型,直接用测试集数据进行验证
时间: 2023-06-01 17:06:20 浏览: 117
这是一段Python代码,用于进行机器学习预测。其中的步骤包括数据清理、数据处理(如对日期进行转换)、对数据进行编码、制定输入和输出变量,并对数据进行训练和测试。最后用到了Keras深度学习框架中的Sequential类。
相关问题
def get_algo_sequence(farm_id, start_time, end_time): path = f'forecast/forecast_LGB_MEDIUM/{farm_id}.csv' forecast = [] for pub_time in pd.date_range(start_time, end_time): res = get_short_alg_forecast(farm_id, 'LGB_MEDIUM', pub_time) tmp_power = res['projectPower'] tmp_speed = res['projectWeather'] tmp = pd.DataFrame({'power': tmp_power, 'speed':tmp_speed}, index=pd.date_range(pub_time, periods=len(tmp_power), freq='15min')) tmp['forecast_date'] = pub_time forecast.append(tmp) forecast = pd.concat(forecast) forecast.index += timedelta(hours=8) os.makedirs('forecast/forecast_LGB_MEDIUM/', exist_ok=True) forecast.to_csv(path)
这个函数接受三个参数:`farm_id`、`start_time`和`end_time`。它定义了一个名为`path`的变量,其值是一个字符串,包含了一个文件路径,这个路径包含了`farm_id`作为文件名的一部分,同时指定了一个目录名。接下来,定义了一个名为`forecast`的空列表。然后,使用`for`循环遍历从`start_time`到`end_time`之间的日期范围。在每次循环中,使用`get_short_alg_forecast`函数获取短期算法的预测结果,其中`farm_id`是设施的ID,`'LGB_MEDIUM'`是使用的算法类型,`pub_time`是预测的发布时间。然后将预测结果中的`projectPower`和`projectWeather`数据存储到`tmp_power`和`tmp_speed`变量中。接下来,使用`pd.DataFrame`函数创建一个名为`tmp`的新数据框,其中包含两列,一列是名为`power`的列,其值为`tmp_power`,另一列是名为`speed`的列,其值为`tmp_speed`。数据框的索引是从`pub_time`开始,长度为`len(tmp_power)`,频率为15分钟的时间序列。然后,为`tmp`数据框添加一个名为`forecast_date`的列,其值为`pub_time`。最后将`tmp`数据框添加到`forecast`列表中。在循环结束后,使用`pd.concat`函数将`forecast`列表中的所有数据框连接成一个数据框,并将结果存储到`forecast`变量中。然后,将`forecast`数据框的索引增加8个小时(即将其从UTC时间转换为北京时间)。接下来,使用`os.makedirs`函数创建一个名为`'forecast/forecast_LGB_MEDIUM/'`的目录(如果该目录不存在),用于存储数据框。最后,使用`to_csv`方法将`forecast`数据框保存为CSV文件,文件路径为`path`。
def predict_roll_4hour(roll_time, data): forecast_time = roll_time[0:10] roll_time = datetime.datetime.strptime(roll_time, "%Y-%m-%d %H:%M:%S") day_one = predict_days(forecast_time, 2, data) # 数据划分 predict_sum = day_one.iloc[:, 1] time_gap = int((int(roll_time.minute) + int(roll_time.hour) * 60) / 15) pre_ture_4hour = predict_sum[time_gap: time_gap + 16] time_slots = [] for i in range(16): time_slot = roll_time + datetime.timedelta(minutes=15 * i) time_slots.append(time_slot) df = pd.DataFrame({'date': time_slots[0:len(pre_ture_4hour)], 'load(kw)': pre_ture_4hour}) return df 代码优化
可以考虑使用列表推导式来简化代码:
```python
def predict_roll_4hour(roll_time, data):
forecast_time = roll_time[:10]
roll_time = datetime.datetime.strptime(roll_time, "%Y-%m-%d %H:%M:%S")
day_one = predict_days(forecast_time, 2, data) # 数据划分
predict_sum = day_one.iloc[:, 1]
time_gap = int((int(roll_time.minute) + int(roll_time.hour) * 60) / 15)
pre_ture_4hour = predict_sum[time_gap: time_gap + 16]
time_slots = [roll_time + datetime.timedelta(minutes=15 * i) for i in range(16)]
df = pd.DataFrame({'date': time_slots[:len(pre_ture_4hour)], 'load(kw)': pre_ture_4hour})
return df
```
此外,建议在函数开头加上注释,说明函数的功能和输入输出参数的含义,以增强代码的可读性。
阅读全文