没有合适的资源?快使用搜索试试~ 我知道了~
智能系统与应用14(2022)200083绿色安全运动会中防止偷猎的巡逻和信号方案评估Dewan Tariq Hasana,马里兰州,Mosaddek Khana, Muhammad Ibrahima, Mohammed Almansourba孟加拉国达卡达卡大学计算机科学与工程系b沙特阿拉伯阿卜杜勒阿齐兹国王科技城Ar ticlei n f o ab st ract文章历史记录:收到2021年2022年3月19日修订2022年4月23日接受2022年4月26日网上发售保留字:野生动物保护偷猎预防博弈论安全游戏绿色安全机制设计巡逻规划移动传感器非法偷猎对自然生态系统构成威胁,加速动物物种的灭绝,破坏森林和其他自然资源。各国通常部署安全人员保护这些资源免受偷猎者的侵害。然而,由于有关机构缺乏人力,这些资源的保存常常受到阻碍。绿色安全是一门利用博弈论概念来协助人类巡逻的学科,最近出现了缓解这一问题的方法。在过去的几年里,已经进行了大量的研究,对这些安全系统的各个方面,包括偷猎者的行为建模,最佳巡逻路线的生成,和信号机制,以协助警卫。在本文中,我们从以下三个方面对文献进行了贡献。首先,我们提供一个无线电信号计划,以协助人类警卫。其次,我们引入了两个关于警卫模式的概念:(a)“有界性”的概念,它限制了人类警卫的巡逻区域和(b)“跳跃移动”的概念,这是强制放弃在一些时间步巡逻。第三,我们调查所需部署的无人机数量,以实现有效的监测。我们的仿真结果表明,所提出的方案有能力减少偷猎的发生,而在同一时间,减少过度巡逻和燃料的使用。我们的研究重点是分析和比较绿色安全游戏设置的不同变化。在我们的研究中,我们分析和比较了各种巡逻模式的这些不同方面,并根据我们的发现,我们提供了有用的见解,有助于发展绿色安全和一般安全计划的研究领域,包括人力巡逻和无人机,用于防止偷猎者或者是对手的偷猎资源© 2022作者由Elsevier Ltd.发布。这是一个CCBY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)1. 介绍保护野生动物、渔业、林业和类似资源对自然环境和食物链至关重要。动物和植物不仅因其本身而有价值,而且是更广泛的自然生态系统的一部分,为野生动物和人类提供食物,住所,水和其他资源(美国鱼类,野生动物服务等,2013年)。实际上,保护这些资源在粮食安全、农业生产力和公共卫生方面发挥着作用(Grooten& Almond,2018年)。令人震惊的是,据估计,世界∗通讯作者。电子邮件地址:gmail.com(D.T. Hasan),mosaddek@du.ac. bd(医学博士)Khan),ibrahim313@du.ac.bd(M. Ibrahim),imansour@kacst.edu.sa(I.Almansour)。对动物的过度偷猎(Grooten Almond,2018)。保护世界野生动物、森林和渔业并使其免遭偷猎或过度消费的必要性促使世界各地的研究人员制定有效的反偷猎和保护计划。世界各地为保护这些地区投入了大量预算(养护监测中心生物多样性系列,1999年)。受到制止偷猎日益减少的野生动物的必要性的激励,计算科学家近年来提出了博弈论技术,从而产生了绿色安全游戏(GSG)的概念(Fang,Nguyen,Ford,Sintov,&Tambe,2015 a)。在过去的几年里,GSG在学术界和工业界都获得了很大的发展势头。假设参与的代理人是理性和竞争的决策者,博弈论使用数学模型来确定和选择最佳行动。博弈论在许多现实世界中的应用使其在计算研究社区中很受欢迎(Halpern,2007)。安全游戏,特别是https://doi.org/10.1016/j.iswa.2022.2000832667-3053/© 2022作者。出版社:Elsevier Ltd这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)可在ScienceDirect上获得目录列表智能系统及其应用期刊主页:www.elsevier.com/locate/iswaD.T. Hasan,医学博士汗,M。Ibrahim等人智能系统与应用14(2022)2000832更大,是关注现实世界安全问题的一个值得注意的子类(Laszka、Felegyhazi、Buttyan,2014)。在这一领域,绿色安全游戏是指使用博弈论来保护自然资源、动物、鱼类种群和森林等(Fang等人,2015年a)。到目前为止,已经对安全游戏进行了大量的工作,特别是绿色安全游戏(Fang等人,2015a; Fang , Stone , &Tambe , 2015 b; Sinha , Fang , An ,Kiekintveld , &Tambe , 2018; Yang , Ford , Tambe ,&Lemieux,2014)。研究的广泛维度包括开发攻击者的行为模型,以便防御者可以采取最佳策略(Gholami等人,2018),利用基于偷猎数据的监督学习框架(Gholami,Yadav,Tran-Thanh,Dilkina,&Tambe,2019),在现实世界中部署系统以理解并克服实际挑战(Fang等人,2016 a),并纳入移动传感器,以协助人类警卫的信号(邦迪等人,2019年; Xu,Wang,Vayanos,&Tambe,2018年)(无人机作为移动传感器,已经在2020年的Alta n Hacıo g Haglu中得到了很好的研究和开发&;Du 等 人 ,2 018;Fust& Loos , 2020; Teutsch& Krüger ,2012)。我们将在第7节详细讨论这些工作。人类警卫的巡逻可以以各种方式执行此外,目前使用无人机发出的声音信号来阻止偷猎者的替代方案还没有得到太多的关注(详见第4节在这项工作中,我们调查这两个方面。本研究的主要贡献如下:– 我们为无人机引入无线电信号方案。在我们的模拟中,无线电信号在偷猎者捕获率方面比现有的声音信号有显著的优势。– 我们考虑将该区域分解为更小的区域(称为子区域)供人类巡逻或警卫使用,而以前的作品将整个区域视为一个单一实体。– 我们在认为合适的时间步长引入跳跃运动的概念。我们的模拟结果发现,该方案显著减少了移动量,并且发现导致相对较小的每单位压降。– 就游戏规则而言,我们规定偷猎者必须从其中一个边境点进入和离开保留区。这更像是在模仿现实生活中的场景,在文献中发现的现有设置我们还标记了具有可数数字的资源,表1符号列表符号意义Г警卫人数∆无人机数量W偷猎者总数Nω活跃偷猎者Li偷猎者i的袋限Pi偷猎者iNs次区域数目S一组次区域Nc现场单元数p( i,j)单元格的保护状态(i,j)Nsi次区域中的细胞数i国际新闻报在网格位置(i,j)处的场中的特定单元Ci子区域中的单元格集iNηij小区的相邻小区的数量(i,j)ηij小区(i,j)的相邻小区的集合Rij小区的资源索引(i,j)α逮捕率ρ盗猎资源量κ警卫行进的距离φ警卫消耗的燃料共计λ移动跳过值防守方有权采取第一步,即, 在偷猎者袭击目标之前采取立场或做出某些决定。因此,在游戏模型中,警卫和他们的助手(无人机)被认为能够首先占据适当的位置。此外,根据真实场景,它被建模为重复的Stackelberg游戏,这意味着游戏将继续进行多轮。这个问题可以从以下几个方面来定义:场地属性、守卫行为、无人机行为、偷猎者行为和游戏规则。在本节中,我们将描述与这些方面相关的一般设置。具体设置将在第4节中讨论。请注意,表1列出了我们将在整个论文中使用要保护的区域被划分为Nc个离散单元。这些细胞中的每一个都是偷猎者在特定时间步的潜在目标。一个代理(守卫、无人机或偷猎者)必须花费一个时间步移动到相邻的单元格。从小区一次只能到达相邻小区中的一个。每个单独的单元在给定的时间步长被保护或不被保护,其表示如下:.p(i,j)=1如果在单元(i,j)处存在保护,0否则当前存在于小区中的资源。这与以往将资源假设为固定资产的做法形成对比。我们相信,这也模拟了被消耗和减少的现实世界资源属性。论文的其余部分组织如下:第2节提供了一般问题制定的概述,其次是我们在第3节调查的动机。第4节介绍了巡逻和信号方案的拟议变化。我们在第5节中分析了实验结果。我们将在第6节讨论这些发现和相关的实际问题。第七节讨论了与这一主题相关的文学作品。第8对全文进行总结和归纳2. 问题公式化这一系列研究的总体主题是在给定限制的情况下,以尽可能好的方式为地理区域内的特定资源提供攻击者保护。安全游戏的一个值得注意的方面是,它默认是Stackelberg竞争(Sinha等人, 2018),因为它是一个非对称的游戏当偷猎者在同一时间步进入同一牢房时,警卫被认为有能力逮捕他们。如果满足了必要的条件,警卫会收到无人机发出的信号,并通过前往发出信号的牢房来逮捕或阻止偷猎者。因此,如果p(i,j)=1,则偷猎者在踩到单元(i,j)时被逮捕。防御者计算其预期效用,然后选择使其效用最大化的行动。守卫移动的原则是,对于下一个时间步,它们可以移动到相邻单元中的一个,ηij,其中ηij是小区(i,j)的相邻小区的集合,或者保持在当前单元格(i,j)上。为了在下一个时步中移动到相邻小区,随机地,即,以相等的概率从相邻小区中选择目的地小区无人机(Unmanned Aerial Vehicle,简称UAV),又称无人机,是一种在空中飞行的移动设备。无人机在这个安全游戏设置中充当移动传感器。他们被部署来帮助警卫在他们的工作提供信号-在安全博弈中,无人机被视为在一个时间步长内从一个单元移动到另一个单元的智能体D.T. Hasan,医学博士汗,M。Ibrahim等人智能系统与应用14(2022)2000833同时扫描偷猎者并在检测到偷猎者时发出声音信号。如前所述,博弈模型遵循重复的Stack- elberg博弈,这意味着它会持续多轮。在每一轮中,防御者(警卫和无人机)根据其预期效用采取行动,偷猎者也是如此。警卫和无人机的目标是逮捕尽可能多的偷猎者,并保护尽可能多的野外资源。当所有偷猎者成功地从保护区逃脱或被警卫逮捕3. 动机和研究问题有了游戏的一般设置的知识,我们现在可以列出研究问题。为这些地区提供适当和有效的保护计划并不是一项显而易见的任务,因为存在固有的限制因素,例如安全人员短缺,车辆缺乏足够的燃料供应以及购买无人机的资金短缺。一个观察结果是,巡逻和发信号可以以多种不同的方式执行。其中每一个都有自己的优点和缺点,在性能方面。对这些差异有正确的见解可以帮助我们选择一个特定的设置。然而,在现有的文献中,这一领域并没有得到太多的关注。在本文中,我们的目标是最大限度地减少这一差距-具体而言,我们追求以下研究问题:– 声音信号和无线电信号在性能上– 与无界设置相比,当警卫在子区域(有界属性)中巡逻时会发生什么?– 当我们加入跳过巡逻时警卫的一些可能动作的概念时,性能会受到什么影响?– 部署的无人机数量对人员有什么影响,特别是在警卫数量保持不变的情况下?4. 游戏模式:拟议的变化和总体框架在第2节中,我们描述了绿色安全游戏的一般设置。本节描述了(1)我们提出的巡逻设置和信号机制的变化,(2)详细的游戏框架,其中包含我们在领域,资源和代理属性方面的新想法,以及(3)实现的详细算法。4.1. 安全计划的拟议变化我们提出的安全方案的变化可以分为两大类,即基于信号的变化和基于巡逻的变化。下面我们来分别介绍这两种情况。4.1.1.信号类型的变化由无人机执行的信号发送是通知警卫发现偷猎者的过程。在绿色安全游戏的巡逻计划中使用无人机或无人机的概念是一个相当新的概念。很少有论文研究部署无人驾驶飞机的选择及其对该计划性能的影响。其中一篇开创性的论文(Xu et al.,2018年)在这方面提供了一个分析的性能影响,结合声音信号无人机与只使用警卫。另一篇论文(Bondi等人,2019年)报告了无人机的实际部署,而不是理论分析,使用了 光向无人机发出信号这些论文都没有阐明不同类型的信号方法的影响的比较。我们引入无线电信号,并认为这种选择也需要进行调查。下面我们解释声音、无线电和光信号方法之间声音信号、无线电信号和灯光信号:在声音信号系统中,一旦发现偷猎者,无人机就会发出声音,通知附近位置的警卫。 然而,这种声音也提醒偷猎者,从而阻止他们偷猎。相比之下,在无线电信号系统中,无人机发射的无线电信号偷猎者无法检测到,但附近的警卫可以通过合适的电子设备检测到。声音信号阻止偷猎者;偷猎者听到声音后,可能会停止偷猎并逃跑,也可能会转移到另一个牢房继续偷猎。这节省了资源,或者至少迫使偷猎者重新安置自己偷猎。相反,无线电信号不能阻止偷猎者,因此不能节省资源,除非警卫对其信号作出反应并逮捕偷猎者。因此,无线电信号没有好处,人类守卫的干预然而,无线电信号有助于提高偷猎者的捕获率,从而保护资源。这也使警卫有可能抓住偷猎者偷来的资源。另一方面,声音信号会吓退偷猎者,因此响应信号的警卫很可能无法逮捕偷猎者。1.现在让我们谈谈光信号方法。从无人机发出的光信号不能从除了目标细胞之外的任何其他细胞观察到。这意味着光信号不会通知其他牢房的警卫,除非有任何单独的通知警卫的程序。因此,偷猎者在接到信号灯时,可能不会立即停止偷猎并撤退总而言之,声音信号通知偷猎者和附近的警卫,无线电信号通知警卫而不阻止偷猎者,光信号只通知偷猎者而不通知任何警卫。因此,我们认为光信号是三种方法中的无效方法,因此我们在本文中不进一步考虑它。4.1.2.巡逻类型根据现有的工程,警卫在整个需要保护的区域巡逻。我们引入了一个新的概念,称为“有界性”,这是一个警卫或无人机分配到一个特定的子区域,而不是整个保护区。由于燃料成本是需要降低的重要参数,在保持相同性能水平的情况下,如果守卫移动较少,则会更好。受此启发,我们引入了另一个新的概念,我们称之为“移动跳跃”。这些想法被描述为-低。“有界性”-有界防护与无界防护:我们将整个区域划分为多个子区域进行防护。 有界守卫意味着守卫和无人机的行动被限制在某个子区域,以节省燃料。另一方面,在无界守护方案中-如前所述-除了文献,警卫和无人机在整个地区移动“Move skip” - compulsory movement skipping at some timesteps by guards: 当移动跳过值设置为整数k,那么守卫每k+1个时间步移动一次因而在1然而,这并不允许警卫采取从不响应声音信号的策略,因为从战略上讲,如果警卫从不响应无人机发出的声音信号,希望偷猎者听到声音后会醒来,那么聪明的偷猎者很快就会学会忽略声音信号并继续偷猎(Xu et al., 2018年)D.T. Hasan,医学博士汗,M。Ibrahim等人智能系统与应用14(2022)2000834×=、⎢⎦×⎡⎤默认操作模式,其中k=0,防护装置在每个时间步移动。作为另一个示例,在k=1的情况下,守卫每两个时间步移动一次。4.2.我们的框架考虑到第2节中描述的游戏模型的一般设置,在本小节中,我们提出了我们的框架的具体细节,包括上面提出的不同设置的变化。此外,我们还介绍了一些小而有趣的设置相比,现有的作品 以使假设更倾向于现实生活中的情景。4.2.1.字段属性如第2节所述,要保护的区域被划分为Nc个离散单元,其中C是离散单元的集合。我们进一步假设整个区域被表示为网格信元我们考虑问题公式的正方形单元,因为假设一些其他形状的单元(例如六边形、八边形)与正方形单元的假设相比没有显著改善。我们假设每个单元格为1 km1公里1平方公里在地理大小上,保持它与著名的PAWS算法一致(Fang等人,2016年a)。假设n的值,即场维数为10。因此,我们在模型中考虑的整个区域是10公里×10公里=100平方公里。2每个单元可以用n×n矩阵的元素表示,其中n=Nc如下:如前所述,我们考虑两种类型的无人机信号方法:声音和无线电。在声音信号方案中,信号是可听的,并且可以被相邻单元内的任何警卫或偷猎者听到,显然也可以被发病单元听到。当听到声音时,偷猎者试图逃离现场,而不管他处于什么状态(即,移动、偷猎或逃跑)。因此,声音信号方案具有阻止偷猎者远离现场的潜力,但这使得附近的警卫难以逮捕偷猎者。另一方面,无线电信号可以传播很长的距离-具体来说,整个地区,并且不能被偷猎者听到。这有助于警卫逮捕偷猎者,但缺乏立即阻止偷猎者的功能。因此,这两个方案都值得研究。4.2.3. 防护性能如前所述,在有界巡逻方案中,一个警卫被分配给一个子区域(s∈S),他的运动总是在该子区域内。在无限巡逻方案中,允许警卫移动到整个区域的任何位置。 在声音信号方案中,小区(i,j)中的守卫只能从他的任何相邻小区感知无人机信号。在无线电信令方案中,警卫可以感知来自整个区域的任何小区的无线电信号。在利用无线电信令(BR)的有界保护方案中,警卫只有在无人驾驶飞机在他的分区内时才对无线电信号作出反应。在无线电信号(UR)无限守卫方案中,由于无人机与特定守卫没有关联,因此守卫必须决定是否对无人机做出响应根据无人机所在小区的距离,⎡S=⎢⎣(1,1) (1,2) (1,3) 。. . . (1,n − 1)(1,n)(2,1) (2,2) (2,3) 。. . . (2,n − 1)(2,n).... . . . ...... . . . ...... . . . ..(n-1,1)(n-1,2)(n-1,3). . . . (n-1,n-1)(n-1,n)(n,1) (n,2) (n,3) . . . . (n,n-1) (n,n)所在我们假设,只有当信令无人机在其中保护在中间小区中的5 × 5子区域因此,在UR方案中,如果信令无人机在由以下矩阵表示的区域内,则小区(i,j)(i−2,j− 2)(i−2,j− 1)(i−2,j)(i−2,j+ 1)(i−2,j+2)<$(i−1,j−2)(i−1,j−1)(i−1,j)(i−1,j+1)(i−1,j+2)<$在一个时间步上,一个单元中的智能体可以移动到它的任何相邻单元,其集合由ηij表示。如果假设有界方案,则相邻单元必须位于同一子区域内,否则考虑整个区域的单元。在正方形单元网格结构中,一个单元可以具有最多八个相邻单元,即Nηij ≤8。可以考虑两种类型的资源建模:数量少且仅存在于少数小区中的非常高的价值,以及大量存在于野外且分散在整个区域中的低价值资源。第一类的例子是稀有或濒危动物,如孟加拉虎,犀牛等。第二类的例子包括大量发现的动物,如鹿,鱼群等。在本文中,我们考虑第二类资源。其原理是,由于我们用于比较不同设置的评估指标之一是被窃取的资源量,因此选择第二个模型有助于我们获得更细粒度和可靠的结果,从而为我们提供相对更精确的比较。我们用一个非负整数表示每个小区的资源量,Rij在一定的实际范围内。在现场偷猎时,偷猎者每次减少1的资源价值时间步长4.2.2.无人机属性在有界巡逻方案中,无人机被限制在子区域si的单元集合Ci内。它的信号只能由Ci中的细胞内的警卫应答。在无界巡逻方案中,无人机可以在整个区域自由移动2虽然这个值可能与一些真正的森林相匹配,但其他森林的大小可能更大或更小。(i,j−2)(i,j−1)(i,j)(i,j+1)(i,j+2)(i+1,j- 2)(i+1,j- 1)(i+1,j)(i-1,j+ 1)(i+1,j+2)(i+2,j- 2)(i+ 2,j- 1)(i+ 2,j)(i+ 2,j+ 1)(i+ 2,j+ 2)关于如前所述的在默认操作模式下,守卫在每个时间步移动。当k=1时,守卫每两个时间步移动一次。4.2.4. 偷猎者特征我们假设偷猎者考虑了旅行的距离。对于偷猎者来说,在偷猎后或收到无人机的声音信号后逃跑,旅行更短的距离对偷猎者来说更有奖励。我们进一步假设偷猎者彼此独立并且不同步,因此在给定的时间步,一个以上的偷猎者可以最终在一个细胞中。在注意到无人机的声音信号后,偷猎者立即试图离开现场,以避免可能的逮捕。偷猎的行为需要额外的时间步,而不仅仅是通过一个网格。偷猎者在一场比赛中只能收集到一定数量的资源,然后他要么被逮捕,要么在听到无人机发出的声音信号后离开。对于偷猎者i,偷猎极限由Li表示。偷猎者需要花费一个时间步来偷猎一个资源值。一旦偷猎者收集到他能携带的最大数量的资源(等于Li),他开始通过最近的边界点从保护区撤退;这使他的逃跑距离最小化。偷猎者也可能决定停止偷猎并逃离当当前小区⎣⎤⎥⎥⎦D.T. Hasan,医学博士汗,M。Ibrahim等人智能系统与应用14(2022)2000835、我还没有填满。 偷猎者对声音信号的反应是算法1:博弈算法。要么是试图从目前的位置撤退到边境或转移到另一个地方继续偷猎。4.2.5. 游戏规则我们假设偷猎者和警卫都有关于第(i,j)个小区的资源索引Rij的信息。偷猎者p试图在一场比赛中偷猎其能力范围内的最大数量,Lp。偷猎者必须在一场比赛中进出警戒区。偷猎者只能从边境进入保护区。因此,在我们的设置中,偷猎者Cinit=cij使得i=1或i=n或j=1或j=n,其中n=Nc.如前所述,当偷猎者在相同的时间步进入同一个牢房时,警卫就会抓住他们。如果偷猎者被逮捕,他侵占的资源就会被收回。如果一个偷猎者偷猎了一个特定的细胞,该细胞的资源在游戏的剩余时间里会减少。当每一个偷猎者从守卫区撤退或被守卫逮捕时,游戏终止,在这种情况下,活跃的偷猎者的数量变为零(ω=0)。在下一节描述的实验中,我们的任务是检查性能指标,即捕获偷猎者的数量,偷猎的资源量以及守卫为移动所花费的燃料量。4.3.博弈算法在这一小节中,我们给出了我们的安全博弈模型的伪代码。我们专注于每个不同因素对游戏结果的影响。 衡量巡逻方案优劣的关键指标是:偷猎者的抓捕率α、偷猎资源量ρ和巡逻过程中消耗的能源或燃料量φ。 注意,防护装置消耗的燃料与它们所覆盖的距离成正比,因此,φκ。 理想情况下,防御者希望最大化捕获率α,同时最小化偷猎资源量ρ和燃料消耗量φ。有四个程序,即主游戏算法,警卫程序,无人机程序和偷猎者程序。 游戏算法设置并重新配置字段,并在每次调用时调用部署代理(即警卫,无人机或偷猎者)的三个子例程。请注意,这些是模型的模拟算法,描述了所涉及的代理在实际场景中的行为。这些算法不是实时算法,因此它们的执行时间不会影响所讨论方案的实际性能。这些租赁的复杂性不是解决方案本身的复杂性,而是我们在进行实际部署之前分析和做出决策的模拟的复杂性。考虑到典型病例的时间跨度可以是3-4天(Fang等人,2016b),在我们的情况下,一次模拟试验的执行时间通常小于一分钟,可以忽略不计。此外,在满足特定标准或达到特定时间限制时,它不会结束的意义上,防护过程是不停止过程,因此,描述防护者和无人机行为模式的子例程2和3具有不通过自身终止而是通过父例程终止的无限循环当模拟在满足特定终止标准后停止时,为1。这是因为只要在实际的sce- nario中执行该计划,警卫和无人机的操作就会继续(个人可以轮班,但角色保持活跃1输入:警卫人数,无人机人数,人数偷猎者的数量W,尝试次数t,移动跳跃值λ;2输出:捕获率α,资源偷猎量φ,移动距离δ;3初始化:活跃盗猎者的数量ω=W;4 对于1到t做5初始化field_resources;//为字段的每个单元分配资源索引6为1到1007init_guard(λ);//在循环端89为1到10010init_drone();//在循环11端部12为1到W做13init_poacher();//在循环的每次迭代中部署poacher14的端当ω>0时,16如果检测到poacher_escape_detected或poacher_arrest_detected然后17更新ω;月18日结束19终20export_result();//导出模拟结果进行分析21end_execution();22端部并因此保持在我们的算法中操作偷猎者如下一段所述,当满足某些条件时,父例程1终止自身和现有的活动子例程。算法1说明了博弈算法。在第1行,我们导入游戏的代理数量,即警卫,无人机和偷猎者的数量。我们还导入了游戏的三次测试的数量,即,在发布平均结果之前游戏将被玩的次数,以及移动跳过值。在第3行,我们初始化活跃偷猎者的数量,即偷猎者总数。在第4行,我们开始一个循环,在这个循环中,代理被部署,游戏被执行。在第5行,我们初始化字段资源,即,在这个领域的每一个细胞的资源量。在第6、9和12行,我们分别运行循环来部署守卫、无人机和偷猎者,从而在单独的线程中开始他们的操作。在这些循环中,guards、drone和poachers子例程分别在第7、10和13行被调用,每次被调用时它们都会启动自己的单独线程。这些代理的例程可以在算法2-当这些线程并行执行时,我们在第15行启动一个while循环,它继续监视是否有偷猎者仍然活跃;当活跃的偷猎者数量为零时,我们终止游戏的特定试验或实例。在第6行的循环中,我们检查是否有任何关于偷猎者离开或被逮捕的更新,如果发现,那么在第17行,我们更新活跃偷猎者的数量。在所有的试验都完成后,我们计算平均结果并将其导出。然后,我们结束游戏的执行现在我们解释算法2中所示的警卫在第1行,我们导入move skip值。在第2行,我们设置了po-D.T. Hasan,医学博士汗,M。Ibrahim等人智能系统与应用14(2022)2000836算法二:守卫1输入:移动跳过值λ;2初始化:位置,模式:= 0,守卫_移动_计数:= 0,目标:=空,切换_计数:= 0;3 whiletruedo4toggle_count:=toggle_count %(λ+ 1);5如果当前单元格中存在偷猎者,则6arrest_poacher();//守卫逮捕当前单元格中的任何偷猎者7端8如果探测到无人机信号,9target:=set_target();//守卫将他的目标设置为对无人机信号检测的响应,并将他的模式设置为1mode:= 1;10端部11如果mode = 0,则12如果toggle_count = 0,则13make_stochastic_valid_move;//仅当模式中toggle_count为0时,guard才移动0increment_guard_move_count;14的端15else ifmode = 1then16move_towards_target();//在模式1中,守卫移动始终忽略toggle_count为0incrementguard_movee_count;17如果达到目标,则18mode:= 0;//到达目标设置mode为019终20递增toggle_count;21end算法4:偷猎者的套路。1初始化:位置,目标,模式:= 0,挖取量Pi:= 0;2 whiletruedo3如果mode = 0,则4.move_toward_target();5如果达到目标,则6mode:= 1;//如果达到目标,poacher将其mode设置为17端端89else ifmode = 1then如果发现无人机信号,11r:=get_random_integer(0,1);//在发现无人机信号时,偷猎者stochdog决定要么逃跑,要么设置另一个目标,如果r= 0,则12mode:= 2;其他13个14初始化目标;15mode:= 0;16端部17否则,如果Pi= Li,则18mode:= 2;19else如果单元格为空,则20初始化目标;21mode:= 0;其他22个23递减R位置;//偷猎并递减当前小区的资源Pi;24端部25else ifmode = 2then26f ix_escape_point();//在模式2中,偷猎者设置他的逃逸点模式:= 3;27如果mode = 3,算法三:无人机1初始化:位置,drone_move_count:= 0;2 whiletruedo3如果当前单元格中存在偷猎者,则4//drone检查当前单元格中是否存在偷猎者5emit_signal();//drone在检测到偷猎者时发出s信号6端部7make_stochastic_valid_move;//无人机继续巡逻8个增量驱动器;9端部守卫在场上的位置,守卫的移动计数为0,守卫的目标为空,切换计数为0。初始位置是随机选择的有效区域内的特定后卫。对于有界方案,初始位置在指定特定保护的子区域内确定。对于无界方案,初始位置在整个场中随机选择。模式值确定了防护装置的操作模式:0是因为模式值表示正常操作模式,并且防护装置在模式0下的行为取决于玩游戏方案的类型。模式值为1时, 处于紧急模式,该紧急模式涉及对感知到的无人机信号作出响应并忽略移动跳过值。toggle_count是一个变量,它从0逐渐增加到move skip值,然后再返回到0;只有当28flee_adv();//在模式3中,偷猎者向逃跑点前进,如果到达了_border_point,则29mode:= 4; //如果到达逃逸点,poacher将他的mode设置为430端31else ifmode = 4then32escape();//在模式4中,poacher从字段中逃逸incrementnum_of_ led_poachers;33例破裂;34的端模式值为0。在第3行,我们开始了一个循环,在这个循环中,守卫的操作开始了。第4行计算该操作的toggle_count。在5号线,警卫检查偷猎者,在6号线,他逮捕偷猎者。在第8行,警卫试图检测任何传入的无人机信号(无线电信号或声音信号,取决于方案的类型),并且如果注意到无人机信号,则他在第10行将其模式设置为1。第12行和第17行标记了两个可选的条件,在这两个条件下,守卫以两种不同的方式行动。如果mode设置为0,则警卫继续执行正常巡逻任务通过根据移动跳跃值在随机方向上采取一步。此外,该名警卫坚称,他没有走出指定的分区。如果模式设置为1,则保护采用紧急模式,在该模式中,他忽略toggle_count值并在每个时间步长移动。我们还在第15行和第19行交替地增加守卫的移动计数。在第20行,我们检查是否到达无人机信号单元,如果到达,则警卫返回到模式0。在第23行,toggle_count递增。整个过程在一个单独的线程中不断重复,直到主D.T. Hasan,医学博士汗,M。Ibrahim等人智能系统与应用14(2022)2000837程序在检测到算法1中提到的终止条件时结束游戏。算法3显示了drone子例程。 在第1行,无人机的初始位置在其被分配的子区域内随机设置,或者根据无人机的类型在总区域内随机设置。“有界性”方案。之后,在第2行,我们开始一个包含drone操作的循环。在第3行,无人机扫描它所在的小区是否有偷猎者;如果检测到任何偷猎者,则在第4行它根据信号方案的类型发射无线电或声音信号,以通知在可到达的距离内巡逻的警卫或阻止偷猎者进入该牢房。以线6、无人机在其有效子区域内进行随机移动或根据方案的类型而被保护的总面积。在行7处,无人机的移动计数递增。这个循环在一个单独的线程中继续,直到主程序结束游戏。算法4描述了偷猎者子例程。在第1行,我们初始化偷猎者的位置和目标单元格。位置被强制随机初始化为边界单元。假定偷猎者知道小区资源值,因此他们从不将其目标设置为不包含任何资源的小区。偷猎者有五种不同的操作模式。在第2行,我们启动一个循环,执行偷猎者第3、9、27、30、35行包含我们检查操作模式的条件。当在模式0时,偷猎者在每次迭代中通过一个位置接近他的目标。在到达目的地单元格时,偷猎者将其模式更改为1,表明目标-已到达get单元格(第6行)。在模式1中,如果偷猎者检测到任何无人机信号如果偷猎者如果偷猎者所在的牢房是空的,他会重新锁定目标,并将模式设置为0。如果第10行、第18行和第19行中的这些条件都不存在,20为真,则偷猎者在每个时间步偷猎一个单位的资源,如第24和25行所示。如果模式设置为2,偷猎者固定了他将在离开球场之前前往的逃跑边界点。最近的边界点被选择为逃跑点。然后在第29行将模式设置为3。在风尚3.偷猎者向逃跑点移动。在到达逃逸点时,在第33行将模式设置为4。在下一个itera-因此,除非偷猎者被抓住,否则偷猎者在线36处逃脱,并且被捕获的偷猎者的数量相应地在线37处增加。在第38行,循环结束,poacher子例程结束执行。5. 实验结果分析在本节中,我们将使用模拟结果分析各种设置除了上面提到的,我们在接下来的实验中增加了另一个维度:增加无人机的数量,同时保持警卫的数量不变。这种情况与现实生活有直接的相似性,因为一群警卫可能会在盲目购买新无人机之前考虑增加无人机数量是否会提高性能。概括一下,我们的环境变化有三个广泛的主题,如下所示:– 如果一名警卫在一个次区域而不是整个区域巡逻,对业绩有何影响?– 如果一个警卫跳过了他指定区域的某些区域,表现会受到什么影响?为了达到这个方案的极端,如果一个警卫在收到无人机信号之前根本不动,那么性能会受到什么影响?– 无线电和声音信号方案如何影响性能?– 无人机的数量如何影响性能?绩效通过以下三个指标衡量– 抓到的偷猎者的数量– 偷猎者偷猎的资源数量-越少越好。请注意,这两个指标不一定相互关联。– 用于巡逻的燃料量-越低越好。请注意,这与警卫行进的距离直接相关。四种基本的防护组合 和 信令 方案 因此,利用无线电信号无人机(BR)的有界防护、利用无线电信号无人机(UR)的无界防护、利用声音信号无人机(BS)的有界防护以及利用声音信号无人机(US)的无界防护。如果提到移动跳过(MS)值,则它对应于警卫进行每次移动时跳过的移动次数。 如果没有提到,默认情况下,移动跳过值被认为是0。 此外,我们还尝试了另一种名为非移动代理(NMA)的变体,其中警卫不会移动到其他细胞中,除非他们收到无人机信号。 在下文中,通过术语“代理编队”,我们表示参与游戏的单个实例的警卫、无人机和偷猎者的数量。 代理形成表示为:(涉及的偷猎者数量,雇用的警卫数量,雇用的无人机数量)。例如,(10,5,8)表示游戏中有10名偷猎者、5名警卫和8架无人机。 第i个偷猎者的偷猎极限Li假定为10。保护区假定为10 km× 10 km= 100平方公里的土地。 我们假设小区(i,j)的场资源值Rij是整数0到50之间的数字,表示单元格的丰富度5.1. 无线电信号与声音信号在图1中,我们显示了在四个方案中捕获的偷猎者的百分比。这表明BR方案比其他方案产生更好的捕获/捕获率。UR方案实现的第二好捕获率。这表明无线电信号方案在偷猎者捕获率方面优于声音信号方案。在图2中,我们显示了偷猎者非法偷猎的资源量。同样,BR方案显示出最佳结果。此外,无线电信令方案的优越性在这里也成立。基于图1和2,我们选择两个基本的变化,即,BR和US方案是比它们的对应方案更好的无线电和声音信令方案(在有界性方面),以便即使当我们改变移动跳跃值时也在无线电和声音信令方案之间进行比较。图3示出了即使当移动跳过值增加时,BR方案也优于US方案。此外,从这张图中可以清楚地看到,无线电信号和声音信号方案已经分组在单独的集群中,表明无线电信号在偷猎者捕获率方面的优势。即使是移动跳过值 3版本的BR方案明显优于移动跳跃值0版本的US方案,用于5个或更多个保护。请注意,BR和US方案的移动跳跃值3版本仅消耗移动消耗的燃料量的25跳过值0版本。图4中的曲线图示出了警卫在游戏中行进的距离,其直接对应于巡逻所花费的燃料或能量使用。这表明移动跳跃值1将巡逻中的燃料或能量消耗减少了大约一半。有些--与直觉预期的相反,减少运动并不一定会使我们达到比例D.T. Hasan,医学博士汗,M。Ibrahim等人智能系统与应用14(2022)2000838图1. 在不同的计划(BR,BS,UR和US)中,每个编队捕获的偷猎者的百分比。图2. 不同方案(BR、BS、UR和US)中每个地层的偷猎资源量。图三. 跳跃动作的效果:在不同的方案中,每个编队捕获偷猎者的百分
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++多态实现机制详解:虚函数与早期绑定
- Java多线程与异常处理详解
- 校园导游系统:无向图实现最短路径探索
- SQL2005彻底删除指南:避免重装失败
- GTD时间管理法:提升效率与组织生活的关键
- Python进制转换全攻略:从10进制到16进制
- 商丘物流业区位优势探究:发展战略与机遇
- C语言实训:简单计算器程序设计
- Oracle SQL命令大全:用户管理、权限操作与查询
- Struts2配置详解与示例
- C#编程规范与最佳实践
- C语言面试常见问题解析
- 超声波测距技术详解:电路与程序设计
- 反激开关电源设计:UC3844与TL431优化稳压
- Cisco路由器配置全攻略
- SQLServer 2005 CTE递归教程:创建员工层级结构
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功