远程实验室中移动机器人的追踪与躲避实验

120 浏览量更新于2023-11-30 收藏 962KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

2013年8月28日至30日，国际自动控制联合会第10届IFAC研讨会控制教育进展。英国谢菲尔德自动控制实验室中移动机器人的远程追踪-躲避实验Marco Casini，Andrea Garulli，Antonio Giannitrapani，AntonioVicino信息工程与数学科学系Via Roma，56，53100 Siena，Italy电子邮件：{casini，garulli，giannitrapani，vicino}@ ing.unisi.it翻译后摘要：远程实验室教学控制系统和机器人技术的使用越来越受到控制界的关注远程实验室的主要优势之一是可以轻松地在现有设置中包含新的真实实验，并通过互联网与学生共享在本文中，一个新的功能的移动机器人安装嵌入在自动控制实验室。已经开发了一个追捕者-逃避者设置，涉及两个基于LEGOMindstorms NXT技术的移动机器人。学生可以选择扮演哪个角色（追赶者或逃避者），并设计最佳控制策略以实现预期目标。几个实验报告，以证明所提出的环境的灵活性。关键词：远程实验室，移动机器人，追逐-逃避游戏1. 介绍近年来，远程实验室在各个学科的教育专业人员中越来越受欢迎。自动控制系统和移动机器人等教学科目预计将从ICT工具的采用中大大受益，从而节省成本和时间。事实上，通过互联网免费访问的远程实验室允许学生在世界任何地方进行真实的、可能昂贵的物理过程与此同时，它们为教师提供了宝贵的支持，这些教师可以以最小的努力安排真正的实验，也可以处理大型课程（Dormido [2004]，Gomes和Bogosyan [2009]）。与其他技术教学辅助工具（如模拟环境或虚拟实验室）相比，远程实验室的一个显著特征是保留了与真实实验的交互。一方面，这激发了学生的兴趣，他们可以在实验期间看到真实设备的演变，这要归功于这些实验室通常提供的实时视频流另一方面，用真实的过程进行实验更具挑战性和指导性，因为人们必须面对许多在仿真中经常被忽视的现实问题。后者在处理移动机器人或自主代理时至关重要。从低级控制律到高级运动协调算法，对真实机器人的实验验证对于评估其在真实操作条件下的有效性为了这个目的，最近已经提出了一些用于移动机器人领域的教学和研究的实验装置，例如，见 Marshall 等人 [2006] ，Mastellone等人[2008]，Taskin和Chernova [2013]。一个有趣的问题，涉及一组自治代理是所谓的追逐者-逃避者（PE）的游戏。在其最基本的设置中，一个代理（追捕者）必须抓住一个逃跑的代理（逃避者）。根据域，PE算法已经被提出用于在离散图上移动的代理（ Parsons [1976] ，Bopardikar et al. [2008]）或在连续空间中移动的机器人（ Lim et al.[2004] ， Gerkeyetal.[2006] ， Stipanovicetal. [2010]）。本文介绍了一种适用于移动机器人体育实验的远程实验室。直观的图形界面允许用户指定一些实验参数和可视化的实验演变在线。通过上传适当格式的Matlab函数，可以选择预定义算法或测试由此产生的框架具有高度的通用性，同时非常容易使用。这项工作扩展了以前的实验设置，重点是测试一组机器人的运动协调策略（ Casini etal.[2011]）和避障所开发的设置可通过自动控制远程实验室在全球范围内免费访问，该远程实验室是在锡耶纳大学开发的（Casini et al. [2004年]）。本文的结构如下。在第2节中，简要概述了拟议的实验装置的硬件和软件架构。第3节从PE游戏的基本工作开始，突出了所提出的设置的一些特点，这些特点影响了允许的PE策略。第4节描述了通过图形界面进行的用户交互。在第5节中报告了高中生和本科生进行的一些实验，而在第6节中得出了一些结论和© IFAC 66 10.3182/20130828-3-UK-2039.00029第十届IFAC ACE2013年8月28日至30日。英国谢菲67YyixiX图二.机器人poseFig. 1. LEGO Mindstorms移动机器人2. 设置描述锡耶纳大学的自动控制实验室（ ACT ）（act.dii.unisi.it）是一个远程实验室，用于控制系统、系统识别和移动机器人领域的教学目的。目前，它提供了五种不同的物理过程可用于远程实验，从简单的直流电机到2自由度的直升机模型。通过Web服务器，用户可以选择预定义的实验或测试ad-hoc控制律。网络摄像头不断提供正在进行的实验的视觉反馈，最后可以下载所有相关数据进行离线分析。最近，ACT增加了一个由四个移动机器人组成的团队，该团队采用乐高Mindstorms技术（The LEGOGroup [2009]）。机器人（见图1）有一个差动驱动器，一个PI控制器运行在NXT块上，以控制车轮速度。安装在实验室天花板上的一对广角摄像机用于实时提取每个机器人的姿态，这要归功于放置在每个车辆顶部的标记（见图1）。运行在台式PC上的服务器不断收集机器人姿势，根据待测试的控制律计算所需的车辆速度，并通过蓝牙连接将其发送给机器人。机器人团队的高保真Matlab仿真器也可使用，加快了控制律的设计。通过这种方式，用户可以离线设计控制策略，甚至无需连接ACT，然后在真实机器人上验证他们的算法。一个额外的工具，非常有用的进行实验的分析，是所谓的“player”，其中hichallowsonetographicallyreproducethehe进化的机器人在实验期间从下载的数据。关于硬件和软件架构的进一步细节可以在Casini et al. [2011年]。3. 追逐者-逃避者博弈PE问题最初是在微分博弈论的背景下引入的，目的是确定两个移动代理碰撞的必要条件（Isaac[1965]）。从那时起，这个问题的一些不同版本得到了解决。例如，在Parsons [1976]中，代理人应该在离散空间中移动，以便问题可以被转换为搜索一个图表。所产生的问题被认为是感测限制的代理，例如。在Bopardikar et al.[2008年]。在处理移动机器人时，运动域自然是连续的，并且可以考虑几个附加方面在Lim等人[2004]中，考虑了经常限制真实车辆机动性的运动学约束。在Gerkey etal.[2006]，提出了一种面向具有有限视场传感器的智能体的PE策略. 我是说，我是说。 [2010]，研究了具有非线性动力学的Agent的捕获（或逃避）策略.为了利用开发的实验装置来设计和测试PE策略，下面的观察是有序的。这些机器人的特点是具有一种独特的运动学.用 pi（t）= [xi（t） yi（t）θi（t）]'表示第i个机器人在时间t的位置和方向（见图2），然后机器人姿态根据模型演变xsteci（t）=vi（t）cos（θi（t）），ysteci （ t ） =vi （ t ） sin （ θi（t）），i=1，. . . ，N，θsteci（t）=ωi（t），其中vi和ωi分别为线速度和角速度re-i。上述运动模型在实践中是相当常见的，并且适用于在L imet al中提出的控制律。 [2004]，Sti panovicetal. [2010]。然而，可用自由空间的有界性对可行的PE策略造成了一些限制。例如，在这种情况下，假设逃避者比追赶者快似乎是合理的，这与Lim等人[2004]在自由空间中移动时通常所做的相反。θi第十届IFAC ACE2013年8月28日至30日。英国谢菲68function[Command]=ACT_pursuer（Pose，Data）V=0. 075;%时间间隔（m/s）w_max=1;%maxangularspeed（rad/s）dx=Pose（1，2）-Pose（1，1）;dY=Pose（2，2）-Pose（2，1）;phi=Pose（3，1）;phides=atan 2（dY，dX）;%desiredhedingW=w_max*（wrapToPi（phides-phi））;%cmutespifabs（W）>w_max，W=w_max*sign（W）;endCommand=[V;W];%returnlinearanddangulspeedend4. 用户界面本节描述允许用户执行远程追踪-规避游戏的图形用户界面（GUI）。 “contro l i n t e r a ce“（图1）。 3）、用户可以选择要扮演的角色、难度级别和实验的最长持续时间。在此阶段，必须上传包含已实现算法的Matlab函数。Matlab函数的输入参数是每个机器人的姿态和包含一些实验数据的结构（例如，实验时间和采样时间），而输出参数是所选播放器的线速度和角速度。对手的算法是预定义的，它是由系统根据用户选择的角色自动选择的。如果学生想同时测试追踪算法和逃避算法，他们必须上传一个包含这两种算法的Matlab函数。在所有情况下，提供合适的值得注意的是，所设计的算法的行为可以通过所提供的模拟器在模拟中进行初步检查尽管由于扰动、未建模动态等原因，实际结果可能与模拟结果不同，鼓励学生在上传文件前测试文件，以验证语法是否正确，以及机器人的行为是否可接受。F I G。 3. “组合式”。一旦上传了包含算法的Matlab文件，就会对用户函数的正确性进行检查。如果没有检查到，则会执行“P E G i n t e f a ce“操作（图1）。4）。该接口已被开发为Java小程序，并允许一个启动/停止远程实验，并观察机器人轨迹。实时图形表示，数值和在线摄像头使学生能够增加实验室的存在感。当时间到了（追赶者获胜），或者当时间到了（逃避者获胜），这种情况下，实验结果会显示出逃避者被追赶（追赶者获胜）。在这两种情况下，可以下载包含有关实验的完整信息的数据以执行离线分析。F I G。四、 “P E G i n t e f a ce“。图五、例1.实现追踪算法的Matlab函数5. 实验测试追逐者-逃避者游戏是一个框架，它允许人们创建适合从高中到研究生和研究生的学生的几个教育场景。事实上，根据给定的实验和所选的角色，可以设计几个不同复杂度的任务;此外，对于给定的任务，可以通过改变玩家之间的速度比来调整难度在下文中，报告了两个复杂性不断增加的示例，以显示拟议设施作为移动机器人控制教育工具的潜力。5.1 例1.三组高中生被要求设计一种能够在追捕者中生存的逃避者算法。追踪器算法被设计为通过将线速度设置为最大值来在每个时间步长指向逃避者（参见图5的Matlab代码）。为了促进任务，一个预定义的功能，能够移动机器人到一个所需的姿势是提供给学生。因此，他们的算法必须计算姿态参考而不是速度参考作为输出。由三个小组设计的算法在成功率方面表现最好，迫使逃避者移动到工作空间顶点附近的四个地方，这取决于追赶者在给定时间步长的实际位置。不允许向非相邻顶点移动（图6）。尽管所提出的策略很简单，但该算法运行良好，并且能够在追赶者的速度第十届IFAC ACE2013年8月28日至30日。英国谢菲693000t=300（s）2500200015001000见图6。例1.学生实施的逃避策略。t=300（s）50000500 1000 1500 2000 2500 3000 3500 4000 4500x（mm）30002500见图9。实施例2.追击者（黑色），闪避者（红色），速度比50%。20003000t=300（s）2500150020001000150050000 500 1000 1500 2000 2500 3000 3500 40004500x（mm）1000500见图7。例1.追击者（黑色），闪避者（红色），速度比50%。00 500 1000 1500 2000 2500 3000 3500 4000 4500x（mm）3000250020001500100050000t=46（s）500 1000 1500 2000 2500 3000 3500 40004500x（mm）见图10。实施例2.追击者（黑色），闪避者（红色），速度比80%。5.2 实施例2.在这个例子中，一个更复杂的控制策略被用于逃避者。追踪器的算法与示例1中相同，而逃避器策略是由一名本科生设计的，并且它基于势场法（Khatib [1986]），该势场法试图根据追踪器和工作空间边界产生的人工排斥势场图9和图10描绘了两个实验的路径，其中速度比分别设置为50%和80%与示例1不同，在两种情况下，逃避者都能够以逃避追捕者。另外的实验表明，见图8。例1.追击者（黑色），闪避者（红色），速度比80%。相对于躲避者的速度来说，小于70%。实验的长度固定为300秒。图在图7和图8中，两个车辆的路径被报告为50%（逃避者获胜）和80%（追赶者获胜）的速度比在这些图中，空心圆和实心圆分别表示机器人的初始和最终姿态机器人路径由实线表示。2134y（mm）y（mm）y（mm）y（mm）第十届IFAC ACE2013年8月28日至30日。英国谢菲70在相同的初始条件下，只有当速度比大于92%时，追逐者才能追上逃逸者。5.3 与模拟的从教育的角度来看，将真实实验与通过提供的模拟器获得的结果进行比较是有趣的。通过比较实例1（速度比50%）的模拟（图11）和实际实验（图7），可以说，第十届IFAC ACE2013年8月28日至30日。英国谢菲71300025002000150010005000t=300（s）0 500 1000 1500 2000 2500 3000 3500 40004500x（mm）传感器和致动器以及来自环境的有限维度的因素起作用并且必须被考虑在内。将所提出的框架扩展到包括结构化环境的游戏（例如，具有虚拟障碍物的机器人），以及多个追击者和逃避者正在开发中。本实验的进一步扩展将涉及Casini等人[2005]报告的学生竞赛设施。事实上，追赶者-逃避者游戏非常适合创造学生挑战;在这里，学生可以在“追赶者-逃避者”游戏中竞争，逃避者可以在最短的时间内抓住预定义的逃避者，或者可以设计逃避者策略，使其能够在预定义的追赶者中生存尽可能长的时间。引用见图11。对速度比为50%的实施例1的模拟实验。t=300（s）3000250020001500100050000 500 1000 1500 2000 2500 3000 3500 4000 4500x（mm）见图12。对于速度比为50%的实施例2的模拟实验。两个轨迹是相似的，虚拟（模拟）实验提供了与现实的良好近似。通过比较实施例2（速度比50%）的模拟（图12）和实际实验（图9），出现了不同的情况。在这种情况下，由于机器人算法的复杂行为，两个轨迹显著不同。这是一个典型的情况下，一个虚拟的实验是无法复制一个真实的。在这种情况下，学生在真实设备上的体验非常有指导意义。6. 结论追逐-逃避博弈是一个非常有趣的话题，它涉及到控制和机器人学中的许多关键概念，从移动机器人轨迹设计到最优控制和博弈论。在自动控制Telelab中嵌入追捕者-逃避者实验已被证明是对学生的激励，他们可以轻松地为两个玩家设计和测试策略，不仅在模拟中，而且在基于 LEGOMindstorms NXT技术的真实机器人上。建议的设置也是有趣的研究人员，谁是能够评估和比较控制律在文献中，在一个现实的情况下移动机器人的局限性S.D. Bopardikar，F. Bullo和J.P. Hespanha。有感知限制的离散时间追逃博弈。IEEETRANSACTIONSONBOTICS ， 24 （ 6 ）： 1429-1439，2008.M. Casini，D. Prattichizzo和A.维奇诺自动控制远程实验室：一种基于网络的远程学习技术。IEEEControlSystemsMagine，24（3）：36M. Casini，D. Prattichizzo和A.维奇诺学生通过远程机器人实验室控制比赛。IEEEControlSystemsMagine，25（1）：56- 59，2005.M. Casini，A. Garulli，A. Giannitrapani和A.维奇诺一个乐高Mindstorms多机器人设置在自动控制Telelab。在 Proc. of the 18 th IFAC WorldCongress ，第9812- 9817页，米兰，意大利，2011中。M. Casini，A. Garulli，A. Giannitrapani和A. 维奇诺一个用于多机器人虚拟障碍实验的远程实验室。在 procofthe9thIFACSymposiumonAdvancesinControlEducation，ppages354- 359 ， Niz h n y Novgorod，Russia，2012.S.Dormido 。控制学习：现在和未来。AnnualReviewsinControl，28：115- 136，2004。B.P. Gerkey，S. Thrun和G.戈登有限视野下基于可见性的追逃。TheInter-nationalJornalofRoboticsReserch ， 25 （ 4 ）： 299-315，2006.L. Gomes和S.波哥相远程实验室的当前趋势。 IEEETransactionsonIndustrialElectronics， 56（12）：4744- 4756，2009。R.艾萨克微分博弈：一种应用于战争、追击、控制和优化的数学理论.约翰威利父子公司，纽约，1965年。O. 哈提卜机械手和移动机器人的实时避障。国际机器人研究杂志，5（1）：90，1986。S.H.林氏T. Furukawa，G. Dissanayake和H.F.杜兰特-怀特追逃对策问题的时间最优控制策略。在Proc. ofthe2004IEEEInternationalConferenceonRobotics and Au tomation，第3962- 3967页，NewOrleans，LA，U S A，2004中。J.A. Marshall，T. Fung，M.E. Broucke，G.M.T. 我是雷乌特里奥，还有B。A. 法语。多机器人协调中的极限环。机器人与自主系统，54（3）：265- 275，2006。S. 马斯泰洛内斯蒂帕诺维奇 Graunke ， K.A.Intlekaleet和M.W.海绵多智能体非完整系统的编队控制和碰撞避免y（mm）y（mm）第十届IFAC ACE2013年8月28日至30日。英国谢菲72理论和实验。The International Journal ofRoboticsResearch，27（1）：107- 126，2008.帕森斯。追逃一graph.在Y.Alavi和D. Lick，编辑，图的理论和应用，第426- 441页。1976年，《史普林格-韦拉尔格》。D. M. 这是一个新的，A。我喜欢你，和N。你好啊。非线性多人追逃对策的对策。InternationalGame Theory Review，12（01）：1- 17，2010.P. Taskin和S. Chernova编辑机器人教育特刊，IEEE教育学报第56卷（1），2013年。LEGO集团乐高头脑风暴主页，2009年。[联机]。可通过以下网址获得：http://mindstorms.lego.com。

下载后可阅读完整内容，剩余1页未读，立即下载