temporal difference
时间: 2023-04-11 16:05:19 浏览: 118
Temporal Difference(时序差分)是一种强化学习算法,用于学习价值函数。它通过比较当前状态的估计值和下一个状态的估计值来更新价值函数,从而实现学习。这种算法可以在不需要完整的环境模型的情况下进行学习,因此被广泛应用于实际问题中。
相关问题
temporal difference learning
时序差分学习(Temporal Difference Learning)是一种强化学习算法,它通过比较当前状态下的估计值和下一个状态的估计值来更新价值函数。这种方法可以在不需要完整的环境模型的情况下进行学习,因此被广泛应用于机器人控制、游戏智能等领域。
tdn: temporal difference networks for efficient action recognition
TDN是一种用于高效行为识别的时间差网络。它结合了时间差学习和卷积神经网络,能够在不需要额外的光流或时间序列数据的情况下,对视频进行高效的行为识别。TDN的设计使得它能够在处理大规模视频数据时具有较高的效率和准确性。
阅读全文