波动驱动学习规则在连续时间循环神经网络控制中的应用

需积分: 10 0 下载量 128 浏览量 更新于2024-08-07 收藏 220KB PDF 举报
"本文介绍了连续时间递归神经网络的波动驱动学习规则,并探讨了其在动力系统控制中的应用。由Kazuhisa Watanabe, Takahiro Haba, Noboru Kudo和Takahumi Oohori共同完成,他们来自北海道工业大学的工程学院。该研究提出了一种新的学习机制,通过在神经元阈值上叠加随机波动来实现学习,波动幅度的概率密度被视为时不变。通过引入辅助函数,学习规则被建立,使得神经元输出和即时误差成为概率量。学习规则基于最速下降法,旨在最小化预期平均误差。这种学习规则无需额外的反馈信号,简化了学习过程。" 文章深入探讨了连续时间循环神经网络(CTRNN)的学习机制,传统的学习规则通常依赖于复杂的反馈结构或精确的误差信号。而波动驱动学习规则则提供了一个新颖的视角,它利用随机波动来驱动网络的学习。在该方法中,每个神经元的阈值受到随机波动nj,p,t的影响,这些波动具有特定的神经元数量、输入模式数量、时间和模式长度属性。波动幅度的概率密度Nj,nj被视为恒定不变,这使得波动的统计特性可预测。 为了将波动与学习关联起来,研究者引入了辅助函数gj,nj,该函数与波动概率密度的导数有关。波动nj,p,t和由此产生的神经元输出rj,p,t以及即时误差e,p,t都被视为概率变量,这使得学习过程具有一定的随机性。由此,学习规则Rji,p,t被定义,它涉及到神经元的时间常数膜电位rj和学习系数P,以及来自第i个神经元的突触权重wjif的变化。 理论分析表明,通过最速下降法,可以有效地最小化预期平均误差,即³0 Tpedt/Tp。这种方法避免了传统学习算法中可能需要的复杂计算,简化了学习过程,同时保持了对动力系统控制的有效性。在动力系统控制的应用中,CTRNN能够利用波动驱动学习规则动态调整其参数,以适应系统的动态变化,实现对系统的有效控制。 这项研究提出了一种创新的学习策略,不仅适用于连续时间递归神经网络的训练,而且在处理动力系统控制等实际问题时展现出潜力。波动驱动学习规则提供了一种自适应且无需额外反馈信号的解决方案,对于理解和改进神经网络的学习性能具有重要意义。