dueling DQN的缺点
时间: 2023-10-09 21:08:37 浏览: 231
1. 需要大量的计算资源和时间:Dueling DQN需要两个网络(Value网络和Advantage网络)来预测Q值,并且每个网络都需要更新和训练。这意味着需要大量的计算资源和时间。
2. 需要更多的数据:Dueling DQN需要更多的数据才能训练两个网络,这可能会导致更长的训练时间和更大的存储需求。
3. 对超参数比较敏感:Dueling DQN的性能受到超参数的影响比较大,需要进行一定的调参。
4. 对于某些问题可能不适用:Dueling DQN适用于连续的状态空间和动作空间,但对于离散的空间可能不太适用。此外,Dueling DQN也可能对某些问题的复杂性不够强大。
阅读全文