
第 41 卷 第 9 期 自 动 化 学 报 Vol. 41, No. 9
2015 年 9 月 ACTA AUTOMATICA SINICA September, 2015
非线性不确定系统准最优学习控制
严求真
1, 2
孙明轩
1
摘 要 针对不确定非线性系统, 提出准最优学习控制方法, 解决参数与非参数不确定特性同时存在情形下的轨迹跟踪问题.
给出迭代学习与重复学习两种控制策略, 根据 Sontag 公式解决标称系统的优化控制, 并以鲁棒学习手段处理参数与非参数不
确定特性. 提出断续函数连续化方案, 以避免传统 Sontag 公式在实现时可能存在的颤振问题. 分析证明经过足够多次迭代或
足够多个周期的重复运行后, 闭环系统可实现系统状态以预设精度跟踪参考信号. 仿真结果表明所设计学习系统在收敛速度
方面快于非优化设计.
关键词 准最优非线性控制, 学习控制, 参数化, 非参数不确定性
引用格式 严求真, 孙明轩. 非线性不确定系统准最优学习控制. 自动化学报, 2015, 41(9): 1659−1668
DOI 10.16383/j.aas.2015.c140781
Suboptimal Learning Control for Nonlinear Systems with Both Parametric and
Nonparametric Uncertainties
YAN Qiu-Zhen
1,2
SUN Ming-Xuan
1
Abstract In this paper, two suboptimal learning control methods, an iterative one and a repetitive one, are proposed
for a class of nonlinear systems with both time-varying parametric and nonparametric uncertainties. Sontag formula
is used for the control design of a nominal system, while the robust learning mechanism is adopted to deal with both
parametric and nonparametric uncertainties. A continuous controller design is carried out in order to avoid the chattering
phenomenon that may arise due to the use of Sontag formula. It is shown that the closed-loop system state follows the
desired trajectory with the pre-specified accuracy, as iteration or repetition increases. Numerical results demonstrate the
effectiveness of the suboptimal learning control scheme.
Key words Sub optimal nonlinear control, learning control, parametrization, nonparametric uncertainties
Citation Yan Qiu-Zhen, Sun Ming-Xuan. Suboptimal learning control for nonlinear systems with both parametric and
nonparametric uncertainties. Acta Automatica Sinica, 2015, 41(9): 1659 −1668
采用学习控制方法, 闭环系统可实现输出信号
对参考信号在整个作业区间上的完全跟踪. 这种控
制方法问世至今已三十年, 这种整个作业区间上的
零误差跟踪性能越来越引起人们的关注
[1]
. 目前, 基
于 Lyapunov 方法设计学习控制器已经成为学习控
制领域的研究热点
[2−3]
, 主要结果集中于参数化方
法, 通过设计微分/差分学习律估计固定/时变未知
参数, 设计控制器实现跟踪任务. 这些工作要求被
收稿日期 2014-11-13 录用日期 2015-03-03
Manuscript received November 13, 2014; accepted March 3,
2015
国家自然科学基金 (60874041, 61174034, 61374103), 浙江省高等学
校访问学者专业发展项目 (FX2013206) 资助
Supported by National Natural Science Foundation of China
(60874041, 61174034, 61374103) and University Visiting Schol-
ars Developing Project of Zhejiang Province (FX2013206)
本文责任编委 王聪
Recommended by Associate Editor WANG Cong
1. 浙江工业大学信息工程学院 杭州 310023 2. 浙江水利水电学院
信息工程学院 杭州 310018
1. College of Information Engineering, Zhejiang University of
Technology, Hangzhou 310023 2. College of Information En-
gineering, Zhejiang University of Water Resources and Electric
Power, Hangzhou 310018
估计参数不随迭代次数变化. 近年来的相关研究结
果考虑非线性参数不确定性
[4]
及与迭代次数相关的
参数不确定性
[5]
等复杂情形. 常规要求期望轨迹是
单一不变的固定轨迹
[6]
, 采用参数化方法时, 也可放
宽为关于迭代次数的非一致轨迹
[7]
. 与参数化方法
相比, 非参数不确定性的假设要求更低, 适用范围更
广, 但到目前为止, 非参数不确定系统学习控制方面
的相关结果较少. 早期的文献主要根据界函数设计
控制量
[8]
.近期的文献结合鲁棒方法和学习方法处
理该类不确定性
[9−11]
.
为了改善学习控制系统的跟踪性能, 可采用最
优学习控制方法. 常规方法需求解关于性能函数的
哈密尔顿–雅可比–贝尔曼方程
[12]
, 但由于求解方程
困难, 实际设计中人们常常追求次优设计. 文献 [13]
针对 MIMO 线性时变参数不确定系统, 提出一种准
最优学习控制方法, 该方法根据 Sontag 公式
[14−15]
给出对应标称系统的准最优控制, 并利用迭代学习
方法估计时变参数不确定性.
初 值 问 题 是 迭 代 学 习 控 制 的 基 本 问 题 之