results = tune.run(HierarchicalTrainer, metric="episode_reward_mean", mode="max", search_alg=algo, scheduler=scheduler, num_samples=1, checkpoint_freq=1, keep_checkpoints_num=10, config=config, # stop=stop )
时间: 2023-05-24 10:00:53 浏览: 222
pid-para-tune.rar_matlab PID_pid_pid tune_tune pid_神经网络PID
这段代码用于运行HierarchicalTrainer模型,并使用给定的搜索算法、调度器和配置,对metric="episode_reward_mean"(剧集平均回报)进行调参,模式为模型最大化metric。该模型将运行1个样本,每个checkpoint_freq个步骤保存1个检查点,并最多保存10个检查点。
阅读全文