离散时变多智能体的有限时间一致性迭代学习控制算法

73 浏览量更新于2024-08-31 收藏 360KB PDF 举报

本文主要研究的是离散时变多智能体系统的有限时间一致性迭代学习控制问题。针对这类动态且变化的系统，研究者提出了一个创新性的控制策略。首先，通过引入虚拟领导者的概念，构建了一个固定拓扑结构，其中虚拟领导者负责生成期望的行为轨迹，而所有智能体则协同工作，共同追踪这个虚拟领导者的动作。每个智能体都配备一个控制器，这些控制器的设计核心在于利用上一迭代周期内，智能体与虚拟领导者之间以及智能体与其相邻智能体之间的跟踪误差。控制器的工作原理是基于迭代学习，即根据上一次控制决策的结果，结合与虚拟领导者和邻接智能体的相对性能，智能体调整其控制律。这种调整是通过拓扑结构中定义的通信权值进行的，这确保了信息的有效传播和协调。通过这种方式，算法能够在每个迭代过程中逐步改进控制策略，目标是趋近于理想控制律，使得整个多智能体系统的输出能够更好地跟随期望轨迹。本文的重要贡献之一是基于范数理论对算法的收敛性进行了严谨的数学证明。具体来说，它提供了算法在λ-范数意义上的收敛条件，这对于理解算法的稳定性和有效性至关重要。作者强调，这个算法的一个关键特性是能够在有限的时间间隔内实现输出的完全跟踪，这是相对于传统控制方法而言的一个显著优势。通过理论分析和大量的仿真实验，研究者证实了所提出的离散时变多智能体系统有限时间一致性迭代学习控制算法的有效性和实用性。这种方法对于解决复杂网络环境下的多智能体协作控制问题具有重要的理论价值和实际应用前景，如在自动化制造、机器人协作和分布式控制系统等领域。因此，这项工作对于推动多智能体系统控制技术的发展具有积极的影响。

第 34卷第 4期控制与决策 Vol.34 No.4

2019年 4月 Control and Decision Apr. 2019

文章编号: 1001-0920(2019)04-0891-06 DOI: 10.13195/j.kzyjc.2017.1362

离散时变多智能体系统有限时间一致性迭代学习控制

曹伟

†

, 孙明

(齐齐哈尔大学计算机与控制工程学院，黑龙江齐齐哈尔 161006)

摘要: 针对一类离散时变多智能体系统, 通过引入虚拟领导者产生期望轨迹的方法, 将虚拟领导者和所有智能

体组成固定的拓扑结构, 在此基础上, 提出一种离散时间迭代学习控制算法. 该算法对多智能体系统中的每个智

能体都设计一个控制器, 各控制器都是利用上一次迭代时, 该智能体与虚拟领导者之间的跟踪误差和该智能体与

相邻智能体之间的跟踪误差, 通过拓扑结构中通信权值的组合不断修正上一次的控制律, 从而获得理想控制

律. 同时, 基于范数理论严格证明所提出算法的收敛性, 并给出算法在 λ-范数意义下的收敛条件. 该算法能够使离

散时变多智能体的输出随着迭代次数的增加在有限时间区间内完全跟踪期望轨迹. 理论分析和仿真结果都表明

了所提出算法的有效性.

关键词: 多智能体系统；虚拟领导者；迭代学习控制；有限时间；输出跟踪；一致性

中图分类号: TP273 文献标志码: A

Finite-time consensus iterative learning control of discrete time-varying

multi-agent systems

CAO Wei

†

, SUN Ming

(College of Computer and Control Engineering，Qiqihar University，Qiqihar 161006，China)

Abstract: For a class of discrete time-varying multi-agent systems, a topology is made up of virtual leaders and all

agents, and a kind of discrete time iterative learning control algorithm is proposed based on the topological structure

by introducing a virtual leader to generate the expected trajectory. The algorithm uses the tracking error between each

agent and the virtual leader and neighbor during the last iteration, to revise successively the last control law through the

combination of the communication weights in the topological structure, and to get the ideal control law. And this paper

proves the convergence of the proposed algorithm based on the norm theory, and gives the convergence condition in the

sense of λ-norm. The algorithm can make the output of the discrete time-varying multi-agent completely track the desired

trajectory in the ﬁnite time interval with the increase of the number of iterations. Both theoretical and simulation results

show the eﬀectiveness of the proposed algorithm.

Keywords: multi-agent systems；virtual leader；iterative learning control；ﬁnite-time；output tracking；consensus

0 引 󲿑

随着计算机技术、通信技术和网络技术的迅速

发展, 在解决大型、复杂的现实问题时, 可以利用多

智能体系统通过各个智能体之间的通讯、协调合作

来替代比较昂贵的单个系统,且工作效率和性能也远

远高于单个系统

[1-2]

. 近年来, 有关多智能体系统协同

控制方面的研究已成为控制领域新兴的研究热点之

一. 多智能体协调控制的研究范畴广泛, 如多智能体

的群集

[3-4]

、编队控制

[5-6]

和一致性

[7-8]

等. 在多智能

体系统的诸多研究问题中,一致性问题是其最根本问

题. 多智能体系统的一致性是指, 所有智能体要在某

些给定的状态和输出上达到一致

[9]

. 目前, 大多数有

关多智能体系统的一致性方面的研究成果, 都是使各

个智能体的状态或输出随时间增加逐渐趋于一致, 即

解决的是多智能体系统的渐近一致性问题. 但像生

产线上的多机械臂协同操作, 这类具有重复运行特

性的多智能体系统,一般都要求在有限时间区间内达

到完全一致性

[10-12]

收稿日期: 2017-10-16；修回日期: 2018-01-23.

基金项目: 国家自然科学基金项目(61672304, 71803095)；齐齐哈尔市科学技术工业攻关项目 (GYGG-201620)；黑

龙江省教育厅基本业务专项理工面上项目(135109240).

责任编委: 王燕舞.

作者简介: 曹伟 (1977−), 男, 副教授, 博士, 从事迭代学习控制等研究；孙明(1979−), 男, 副教授, 博士, 从事神经网

络与优化控制等研究.

†

通讯作者. E-mail: yiyuqq168@163.com.

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38708841

粉丝: 3
资源: 945

离散时变多智能体的有限时间一致性迭代学习控制算法

事件触发机制下的二阶多智能体系统的一致性

具有线性和非线性动力学的异构多智能体系统的有限时间共识

多智能体一致性仿真程序

机器人系统有限时间自适应迭代学习控制.pdf

三次时变参数离散灰色预测模型及其性质

论文研究-二次时变参数离散灰色模型.pdf

论文研究-线性时变参数离散灰色预测模型.pdf

时变ARMAX系统学习辨识算法研究

三次时变参数离散灰预测模型的构建与特性分析

非均匀采样数据系统传感器故障检测的输出时滞方法

最新资源