强化学习Actor-Critic算法在闭环脑机接口控制器设计中的应用

93 浏览量更新于2024-08-29 收藏 332KB PDF 举报

"该研究基于大脑皮层神经元放电活动模型，探讨了闭环脑机接口控制器的设计，采用卡尔曼滤波器和神经网络构建解码器，并利用强化学习中的Actor-Critic算法来优化PID控制器，以提升无感知反馈情况下的系统性能。" 本文主要涉及的领域包括大脑皮层放电模型、神经网络、解码器技术、强化学习以及控制器设计，这些是当前脑机接口（BMI）研究的关键点。首先，文章基于大脑皮层神经元的放电活动模型，模拟并研究单关节的自发运动，这是理解脑机接口工作原理的基础。大脑皮层神经元的放电模式与我们的运动控制密切相关，通过监测和解析这些放电模式，可以解析出个体的意图。接着，文章提出了使用卡尔曼滤波器和人工神经网络来设计解码器，以替代传统的脊髓电流控制。卡尔曼滤波器是一种经典的估计理论工具，能有效处理随机噪声，提高数据的准确性。神经网络则能模拟大脑的学习和适应过程，用于解析大脑信号并转化为实际的动作指令。通过比较两种解码器的性能，可以评估它们在不同条件下的优势和劣势。然而，在没有感知反馈的情况下，解码器的性能会显著下降。为解决这一问题，研究者引入了强化学习中的Actor-Critic算法，这是一种自我学习和优化的方法。Actor-Critic算法结合神经网络设计了一个PID控制器，该控制器产生的刺激信号可以刺激大脑皮层神经元，使得其放电活动能够跟随有感知反馈时的状态，从而恢复或增强解码器的性能。最后，通过与其他控制策略的对比，如传统的PID控制或其他学习算法，证明了基于强化学习的这种方法在人工感知反馈信号设计上的有效性。这不仅提升了闭环脑机接口的性能，也为未来更复杂的脑机交互系统提供了新的思路和方法。这项研究在脑机接口领域做出了重要贡献，它展示了如何通过先进的算法和技术改进脑机接口的性能，尤其是在缺乏直接感知反馈的情况下，这将对瘫痪患者等群体的康复治疗和生活质量产生积极影响。

第 33卷第 11期控制与决策 Vol.33 No.11

2018年 11月 Control and Decision Nov. 2018

文章编号: 1001-0920(2018)11-1967-08 DOI: 10.13195/j.kzyjc.2017.0791

基于Actor-Critic和神经网络的闭环脑机接口控制器设计

孙京诰

1†

, 杨嘉雄

, 王硕

, 薛瑞

, 潘红光

(1. 华东理工大学信息科学与工程学院，上海 200237；2. 西安科技大学电气与控制工程学院，西安 710054)

摘要: 在皮层神经元放电活动模型的基础上进行单关节自发运动的研究, 从控制理论的角度分析闭环脑机接口

的工作原理. 使用卡尔曼滤波器和人工神经网络设计系统的解码器替代原系统的脊髓电流, 并且比较这两种解码

器的优劣. 由于在无感知反馈的信号下, 解码器的性能下降得比较明显, 使用强化学习中 Actor-Critic 算法结合人

工神经网络设计 PID 控制器, 用以产生刺激信号来刺激大脑皮层神经元, 使其能够跟踪有感知反馈信号时皮层神

经元的放电活动, 从而恢复解码器的性能. 最后, 通过与其他控制算法对比, 验证了基于强化学习算法的人工感知

反馈信号设计的有效性.

关键词: 大脑皮层放电模型；神经网络；解码器；强化学习；控制器设计

中图分类号: TP273 文献标志码: A

Design of closed-loop brain machine interface controller based on Actor-

Critic and neural network

SUN Jing-gao

1†

, YANG Jia-xiong

, WANG Shuo

, XUE Rui

, PAN Hong-guang

(1. College of Information Science and Engineering，East China University of Science and Technology，Shanghai 200237，

China；2. College of Electrical and Control Engineering, Xi’an University of Science and Technology，Xi’an 710054，

China)

Abstract: In this paper, the spontaneous motion of the single joint is studied on the basis of the cortical neuron ﬁring

activity model, and the working principle of the closed-loop brain machine inter face is analyzed from the perspective

of the control theory. The Kalman ﬁlter and artiﬁcial neural network are used to design system decoders to replace

the original system of spinal cord current, then the advantages and disadvantages of these two decoders are compared.

Due to the dramatically decrease of the decoder in the absence of natural proprioception, the reinforcement learning

algorithm(Actor-Critic) combined with the artiﬁcial neural network is used to design the PID controller, which can

generate the stimulus signal to stimulate the neurons of the cerebral cortex, track cortical neuron ﬁring activity with the

natural proprioception and restore the performance of the decoder. Finally, the validity of the artiﬁcial sensing feedback

signal design based on the reinforcement learning algor ithm is veriﬁed by comparing with other control algorithms.

Keywords: brain cortical neuron ﬁring model；neural network；decoder；reinforcement learning；controller design

0 引 󲿑

脑机接口 (BMI) 是一种人机结合系统, 其在大脑

与机器之间提供了用于传递皮层神经元电信号的通

道, 进而修复一些受损的运动机能, 它能够帮助运动

障碍患者完成简单的运动任务,从而提高对外交流能

力

[1]

. 患者的脊髓神经元无法准确控制肌肉运动, 同

时肌肉不会根据环境产生反馈信号给大脑而导致其

本体反馈的缺失,因此将采集到的皮层运动信号用于

闭环控制系统研究, 不仅能够完善 BMI 系统的理论

基础, 推动 BMI 系统在实际领域中的应用, 还拓展了

各类控制算法的应用领域,因此具有较高的理论创新

价值和实际应用意义. 脑机接口主要包括神经元放

电活动的测量、运动相关电信号的提取 (解码器) 和

运动相关电信号的反馈 (编码器)3 部分

[2]

, 共同构成

闭环控制系统.

近年来, 国内外针对大脑皮层运动信息提取的

BMI 研究已经取得了较大的进展. 文献 [3] 提出了一

种基于生理学的数学模型, 以表征大脑皮层放电活

收稿日期: 2017-06-20；修回日期: 2017-12-06.

基金项目: 国家自然科学基金项目 (61603295).

责任编委: 曹进德.

作者简介: 孙京诰 (1971−), 男, 副教授, 博士, 从事智能优化算法及其应用等研究；杨嘉雄(1993−), 男, 硕士生, 从事

闭环脑机接口控制器设计与优化的研究.

†

通讯作者. E-mail: sunjinggao@126.com

下载后可阅读完整内容，剩余7页未读，立即下载

weixin_38726186

粉丝: 5
资源: 895

强化学习Actor-Critic算法在闭环脑机接口控制器设计中的应用

Actor-Critic原理+PPO算法推导

网络游戏-基于Actor-Critic神经网络连续控制的快速学习算法.zip

actor-critic.rar_Actor Critic_actor critic 网络_actor-critic_plain

Actor_Critic.zip_actor critic 案例_actor-critic_actor-critic算法_cri

强化学习Soft Actor-Critic算法：基于LunarLander登陆器的Soft Actor-Critic强化学习

simulation.rar_Actor Critic_actor critic 网络_actor-critic_critic

Distributional-Soft-Actor-Critic

ADP冲冲冲_actor-critic_criticactor_ADP神经网络_adp_CRITIC

ADP小程序实现actor-critic神经网络

Actor-Critic神经网络快速学习算法在网络游戏中的应用

最新资源