没有合适的资源？快使用搜索试试~ 我知道了~

首页Q-Learning更新公式

Q-Learning更新公式

强化学习

需积分: 29 13 下载量 140 浏览量更新于2023-03-16 1 收藏 9KB DOC 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

试读

1页

强化学习的参数更新公式。Q-Learning更新公式： Qnew(st-1,at-1)=(1-α)‧Q(st-1,at-1)+α(rt+γ‧maxQ(st,a)) 其中maxQ(st,a)用于查找st 下期望回报最好的行为。α∈(0,1]，γ∈[0,1]，rt 是t时刻的奖赏。

资源详情

资源推荐

Q-Learning 更新公式：

new

t-1

)=(1-α)‧Q(s

t-1

)+α(r

+γ‧maxQ(s

,a))

其中 maxQ(s

,a)用于查找 s

下期望回报最好的行为。α∈(0,1]，γ∈[0,1]，r

是 t 时刻的奖

赏。

1 是

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余0页未读，立即下载

庵中十三居士

粉丝: 68
资源: 9

上传资源快速赚钱

我的内容管理收起

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

会员权益专享

Q-Learning更新公式

Q-Learning算法 Matlab代码实现

matlab Q-learning 无障碍路径规划仿真

文章【强化学习】Q-Learning算法详解中的代码资源

q-learning流程图

请提供Q-learning算法相关知识

传统Q-learning算法

q-learning 路径规划 算法仿真

q-learning三维路径规划

q-learning算法原理

q-learning算法原文

Q-learning介绍

Q-Learning算法

qlearning算法matlab

q-learning算法代码matlab

用q-learnIng算法实现联邦学习优化算法

介绍Q-learning算法（一千字）

你能帮我举一个具体的Q-learning算法加上经验回放例子么？

如何利用q-learning到路径规划中

用q-learning怎么做迷宫

基于q-learning的边缘计算任务卸载策略代码解析

会员权益专享

最新资源

q-learning 路径规划算法仿真