波动驱动学习规则:连续时间递归神经网络与动力系统控制

需积分: 10 0 下载量 188 浏览量 更新于2024-08-07 收藏 220KB PDF 举报
"本文提出了一种用于连续时间递归神经网络的波动驱动学习规则,并探讨了其在动力系统控制中的应用。作者Kazuhisa Watanabe、Takahiro Haba、Noboru Kudo和Takahumi Oohori来自日本北海道工业大学的工程学院。该研究的重点在于通过在每个神经元的阈值上叠加随机波动来促进学习过程。波动幅度的概率密度被视为时间不变量,并引入辅助函数来处理这一问题。学习规则侧重于突触权重的更新,以期望平均误差最小化为目标,采用最陡下降法进行优化。这种学习规则无需任何额外的反馈机制,简化了网络的学习过程。" 本文介绍了一种新颖的波动驱动学习规则,应用于连续时间的递归神经网络(Continuous-Time Recurrent Neural Networks,CTRNN)。CTRNN是一种能够在时间连续域内处理动态信息的神经网络模型,它在模拟复杂时序行为和非线性动力学系统建模方面具有广泛应用。在传统的学习算法中,如反向传播,通常需要精确的误差信号来进行权重调整。然而,波动驱动学习规则采取了一种不同的策略。 在该规则中,每个神经元的阈值不是固定不变的,而是被随机波动nj p,t所影响,这些波动与神经元编号(j)、输入模式编号(p)和时间(t)有关,且具有特定的模式长度Tp。波动幅度的概率密度Nj nj被视为时间不变,便于分析。为了处理这个概率分布,引入了一个辅助函数gj nj,它的导数dgj/dnj乘以gjNj,用以描述波动变化的影响。 学习规则的关键在于突触权重wjifrom i-th neuron的更新。这个更新是基于概率的,即Rji p,t³0,其中tgj是辅助函数,ridW/Wj代表权重更新的速率,pwji是学习系数。更新过程在模式周期Tp内进行,通过积分平均期望误差³0 Tpedt/Tp,可以实现误差的最小化,这相当于在参数空间中执行最陡下降法。 这种波动驱动学习规则的一个显著优势是,它不需要传统的反向传播所需的精确误差信号或额外的反馈机制。这使得网络的训练过程更为简单,且可能更适应不确定性环境和实时学习任务。在动力系统控制的应用中,CTRNN能够利用这种学习规则来动态调整其内部结构,以更好地适应系统的瞬时变化,提高控制性能。 波动驱动学习规则为连续时间递归神经网络提供了一种新的学习机制,该机制允许网络在面对不确定性时自我调整,从而在动力系统控制等应用场景中展现出优越的性能。通过理论分析和实际应用验证,该规则显示了减少平均误差和提高控制效率的潜力。