第 33 卷第 7 期
2016 年 7 月
控 制 理 论 与 应 用
Control Theory & Applications
Vol. 33 No. 7
Jul. 2016
反反反馈馈馈辅辅辅助助助学学学习习习算算算法法法在在在Lebesgue-p范范范数数数意意意义义义下下下的的的单单单调调调收收收敛敛敛性性性
DOI: 10.7641/CTA.2016.50466
毕宏博
1
, 孙明轩
2†
, 陈佳泉
1
(1. 衢州学院 电气与信息工程学院, 浙江 衢州 324000; 2. 浙江工业大学 信息工程学院, 浙江 杭州 310023)
摘要: 针对一类线性时不变系统, 讨论存在固定初始偏移时的学习控制问题, 提出带有反馈辅助项的比例微分
(proportion differentiation, PD)型学习控制算法, 分析所提算法在Lebesgue-p范数意义下的单调收敛性, 获得对期望
轨迹的渐近跟踪结果. 进一步地, 为获得系统输出对期望轨迹的完全跟踪, 给出带有初始修正策略的比例–积分–微
分(proportion multiple integration differentiation, PMID)型学习律, 并给出了所提学习算法的单调收敛性能分析结果.
最后, 通过数值结果, 验证了所提学习算法的跟踪性能和单调收敛性能.
关键词: 迭代学习控制; 反馈辅助; 初始修正; Lebesgue-p范数; 单调收敛
中图分类号: TP273 文献标识码: A
Monotonic convergence of feedback-aided iterative learning control
algorithms in the sense of Lebesgue-p norm
BI Hong-bo
1
, SUN Ming-xuan
2†
, CHEN Jia-quan
1
(1. College of Electrical and Information Engineering, Quzhou University, Quzhou Zhejiang 324000, China;
2. College of Information Engineering, Zhejiang University of Technology, Hangzhou Zhejiang 310023, China)
Abstract: Feedback-aided proportion differentiation (PD)-type iterative learning control is proposed for a class of linear time invari-
ant systems in the presence of a fixed initial shift. Based on Lebesgue-p norm, the monotonic convergence analysis result is obtained,
and the output trajectory asymptotically convergence to the desired one. Furthermore, a kind of PID-–proportion multiple integration
differentiation (PMID)-type learning algorithm with initial rectifying strategy is addressed to realize completely tracking result, and the
monotonic convergence analysis processes are stated. Finally, numerical results are presented to demonstrate the tracking performance
and the monotonic convergence property of the proposed learning algorithms.
Key words: iterative learning control; feedback-aided; initial rectifying; Lebesgue-p norm; monotonic convergence
1 引引引言言言(Introduction)
迭代学习控制
[1]
策略适用于在有限区间上重复运
行的动态系统, 它利用系统第k次运行时输出量与期
望轨迹的偏差更新控制输入量, 获得新的控制信号,
并应用于系统的第k + 1次迭代过程. 这一控制方法因
设计简单, 并不需要系统准确的数学模型, 仅利用系
统较少的先验知识, 即可提高系统的瞬态性能, 并获
得有限区间上的完全跟踪效果, 引起人们的普遍关注.
一般地, 学习算法要求各次迭代初态与期望初
态一致. 系统具体运行时, 要求期望初态已知. 若系
统期望初态未知, 而是允许各次迭代的初态均固定
在某一点上的情形时, 众所周知, 单纯的微分(differ-
entiation, D)型学习律不能保证固定初态条件下的
收敛性, 而比例微分 (proportion differentiation, PD)
型学习律可实现极限输出轨迹渐近收敛于期望轨
迹. 为实现对期望轨迹的一致收敛结果, 文[2]引入
初始脉冲作用, 理论上可以实现除初始点外的完全
跟踪结果, 然而, 这种脉冲修正作用在实际中不可
行. 文[3]首先给出了固定初始误差下D型与PD型
学习的输出极限轨迹, 获得了系统跟踪误差渐近收
敛于零的结果. 文[4–5]提出在学习律中引入初始修
正作用, 用以抵消输出误差初始值对系统收敛过程
的影响, 并针对相对阶为一或高相对阶系统, 提出相
应的学习算法, 并将上述结果推广至离散学习系统.
迭代学习控制算法常采用开环学习或闭环学习
这两种典型方式. 开环学习律依照系统正则性构造,
由于其中的更新量均采用上一次系统运行时产生的
收稿日期: 2015−05−29; 录用日期: 2016−04−25.
†
通信作者. E-mail: mxsun@zjut.edu.cn.
本文责任编委: 詹宜巨.
国家自然科学基金项目(61174034, 61374103, 61573320), 浙江工业大学重中之重学科开放研究基金项目(20151011), 衢州学院人才培养科研启动
项目(BSYJ201505), 高等学校访问学者教师专业发展项目(FX2013195)资助.
Supported by National Natural Science Fund of China (61174034, 61374103, 61573320), Open Top Disciplined Foundation of Zhejiang University of
Technology (20151011), Scientific Research Foundation for Talented Scholars of Quzhou University (BSYJ201505) and Professional Development
of Teachers in Higher Education Institutions (FX2013195).