没有合适的资源?快使用搜索试试~ 我知道了~
首页利用强化学习进行股票操作实战(二)
对于DQN的理论知识,这里不再赘述,不懂的同学可以看之前的强化学习理论篇或自行上网搜索相关资料。 废话不多说直接上代码。 DQN类 首先定义了一个DQN类(这个定义参考了莫烦的代码 [1],几乎与其一致,做了简单修改)。下面简单的说明一下,代码中的核心部分。详细介绍可以看莫烦教学视频或者结合代码自己理解。 class 中包含了5个主要模块,分别是__init__ (初始化),_build_net(网络构建),store_transition(储存过去操作),choose_action(根据状态选择动作),learn(网络学习)。 _build_net:构建了两个结构相同网络eval_net和
资源详情
资源评论
资源推荐

利用强化学习进行股票操作实战(二)利用强化学习进行股票操作实战(二)
对于DQN的理论知识,这里不再赘述,不懂的同学可以看之前的强化学习理论篇或自行上网搜索相关资料。
废话不多说直接上代码。
DQN类类
首先定义了一个DQN类(这个定义参考了莫烦的代码 [1],几乎与其一致,做了简单修改)。下面简单的说明一下,代码中的核心部分。详细介绍可以看
莫烦教学视频或者结合代码自己理解。
class 中包含了5个主要模块,分别是__init__ (初始化),_build_net(网络构建),store_transition(储存过去操作),choose_action(根据状态选择动
作),learn(网络学习)。
_build_net:构建了两个结构相同网络eval_net和target_net。eval_net更新频率较高,target_net更新频率较低。(设置两个网络更新频率不同是DQN模
型的其中一个核心)
store_transition:将过去操作储存起来,s是当前状态,a是当前动作,r是reward,s_是下一时刻状态。
Chose_action:根据当前状态选择动作(采用了贪婪规则)
Learn:进行batch训练



















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0