double q learning
时间: 2023-02-09 07:15:44 浏览: 268
Q learning
Double Q-learning是一种强化学习算法,它在传统的Q-learning算法的基础上进行了改进。在Q-learning中,算法会使用当前状态的Q值来预测下一步的最佳动作,但这种方法存在一个问题,就是估计值会因为过度估计而偏差。Double Q-learning通过使用两个Q表来解决这个问题,一个用来估计最大的Q值,另一个用来选择最佳动作。
阅读全文
Q learning