MACCEPA驱动的双足机器人再励学习行走控制

需积分: 9 0 下载量 123 浏览量 更新于2024-08-12 收藏 310KB PDF 举报
"基于再励学习的被动动态步行机器人 (2008年),这篇论文发表于《清华大学学报(自然科学版)》,作者包括毛男、李实、王家眩、贾培发、杨泽红和丘振,属于自然科学领域的学术论文,主要探讨了双足机器人的被动动态步行控制方法。" 本文介绍了一项针对双足机器人行走的研究,旨在开发出一种仿人且能量高效的步行方式。研究人员设计并制造了一个由MACCEPA(Mechanically Adjustable Compliance and Controllable Equilibrium Position Actuator)柔性驱动器驱动的半被动双足机器人。MACCEPA是一种特殊的驱动器,能够调整机械顺应性和控制平衡位置,这在双足机器人的动态行走中起到了关键作用。 为了实现这种行走模式,论文提出了基于再励学习的控制策略。再励学习是强化学习的一个变体,主要用于让机器人在不断尝试和反馈中优化其行为策略。首先,通过Q-学习方法,机器人在理想的环境中学习稳定的步行步态和相应的控制策略。Q-学习是一种用于确定性或非确定性环境的强化学习算法,它允许机器人通过与环境的交互来学习最优行动策略。 接下来,将通过Q-学习得到的步态和控制策略作为模糊优胜学习的参考输入。模糊优胜学习是一种结合模糊逻辑和学习机制的方法,它可以在线学习模糊网络的参数,以适应环境的变化。在这个过程中,模糊网络的优胜值参数被不断更新,以优化机器人的行走性能。 仿真结果显示,通过应用学习到的控制策略,机器人能够在步行相位转换时有效控制柔性驱动器,从而实现稳定动态步行。这种方法的优点在于,它允许机器人在未知或变化的环境中逐步改善其行走能力,提高了行走的稳定性和效率。 关键词涉及的领域包括机器人技术、双足机器人、被动动态步行以及再励学习。论文的中图分类号为TP242,文献标识码为A,文章编号为1000-0054(2008)01-0092-05,展示了这篇论文在机器人控制理论和实践方面的贡献。