Averaged-DQN是如何减少过估计的
时间: 2024-05-17 08:08:07 浏览: 129
averaged-perceptron-tagger-eng模块下载
根据引用所述,Averaged-DQN通过平均TAEs平均值来减少过估计。具体来说,Averaged-DQN平均了下一个状态的价值估计,从而减少了过估计。与Ensemble-DQN相比,Averaged-DQN在TAE方差减少方面更有效,并且至少比DQN好K倍。因此,Averaged-DQN是一种有效的方法来减少过估计。
阅读全文