异构代理通信机制研究：3D环境中的协作导航任务

代理通信

10 浏览量更新于2024-06-20 收藏 987KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"异构代理的通信机制及其应用研究" 在人工智能领域，异构代理间的通信是当前研究的热点问题。这些代理可能拥有不同的能力、角色和知识，它们需要有效地协同工作来完成复杂的任务。本研究关注的是在3D环境中的异构协作，特别是聚焦于多对象导航任务。在这样的任务中，代理需要共享信息以实现共同的目标，例如导航到特定的目标位置，同时避免障碍。 CoMON（协作多对象导航任务）被提出作为研究平台，它包括一个具有全局地图的"oracle代理"（A0）和一个需要在3D环境中感知和导航的"导航代理"（AN）。Oracle代理能够提供关于环境的全局信息，而导航代理则依赖于局部感知来执行任务。在这种设置下，有效的通信是任务成功的关键。研究者探讨了两种常见的通信机制，一种是结构化的，另一种是非结构化的。结构化的通信通常涉及到预定义的信息格式，而非结构化的通信允许代理以更自由的方式交换信息。通过这两种机制，代理们能够传达它们的意见和对3D环境空间结构的理解。这种紧急通信被发现在理解和解释代理行为时是可解释和接地的，即它们的通信内容与它们的感知和环境紧密相关。过去的研究大多在简化环境中研究通信，比如2D环境或者简单的参考游戏，而3D环境下的沟通研究较少。尽管已有大量文献探讨了涌现通信的概念，但对3D环境中自然产生的通信现象的系统分析和解释仍然缺失。因此，本文旨在填补这一空白，通过自我中心的视角深入分析3D环境中的代理通信，揭示其对导航性能的影响以及消息内容如何反映代理的自我中心感知。通过这项工作，我们可以期待更深入地理解异构代理如何在复杂环境中通过通信有效地协作。这不仅有助于优化多智能体系统的性能，而且对于开发更接近人类交互方式的AI技术具有重要意义。此外，这些发现对于实际应用，如机器人协作、自动驾驶车辆的路径规划以及远程操作的无人机群等，都将提供宝贵的理论指导和技术支持。

资源详情

资源推荐

15955

}

{

CoMON任务。在协作多ON（CoMON）中，事件涉及

两个异构代理A

和A

。

是一个无实体的oracle，它不

能在环境中导航。然而，A

可以访问环境状态的

oracle

是实施的导航器，其导航环境并与环境交互。

执行multiON [64]任务。为了优化团队的（共享）奖

励，两个智能体必须合作。为此，A·

和A·

通过经由

有限带宽信道进行通信来协作地执行任务。

探员观察。A

〇

可以访问场景的固定的自顶向下视图以

及A

将场景离散化并表示为oracle映射M，即3D张量。

前两个维度对应于自顶向下视图的水平轴和垂直轴，

第

三个维度包含每个单元格

[

，

]

中的语义信息：

•

占用

：位置

[

，

]

是否是自由空间（

即

，可导

航）、被占用或在场景边界之外。

•

目标对象

：表示哪个目标

对象位于

[

，

]

或

“

无对

象

”

指示符的分类变量。

的观察结果与multiON [64]一致在时间步长t处，

的观测值包括：

•

RGBD：自我中心的视觉和深度框架。

•

Object：表示当前目标对象为独热向量g

的

分类变

量。

•

前一个动作

：在前一个时间步的

agent

动作，作

为

一个热向量a

。

特工行动空间。在每个时间步，A

和A

都

向彼此发

送消息。在通信回合之后

，

另外采取环境动作。动作

空间由四个动作组成：

向前，

向左，

向右

，

找到

。向前走

代理转发

。

米，每圈

◦

。

任务设计备选方案。我们注意到还有其他

与独立挑战定位问题的强耦合（

即

，通过从AN的角度

的自我中心观察来确定

由于存在基于自我中心视觉

数据的定位的丰富文献（

例如

，参见Fuentes-Pacheco等

人。[28]对于一项调查），我们考虑了这一方面，允许

更深入地关注对紧急沟通的解释

Agent

模型

我们提供了一个概述，我们的代理模型描述的通信

机制，代理网络体系结构，奖励结构和实施细节。

4.1.

通信机制

我们研究两种类型的通信机制：非结构化[25，46]

和结构化[33，34]。它们的关键区别在于非结构化机制

通过实值向量实现自由形式的通信，而结构化通信机

制通过强加的消息结构具有归纳图2说明了这两种类型

的通信。每一轮通信都涉及两个代理同步地向彼此发

送消息。接收代理使用消息来细化其内部表示（

即

，

信念）。相同的体系结构用于两个代理和每个通信回

合。

非结构化通信（U-Comm）。代理通信实值向量消息。

为了发送消息，信念通过线性层传递以产生发送的消

息。在接收侧，接收到的消息与信念连接，并通过两

个完全连接的层，并通过信念跳过连接，以获得细化

的信念。

结构化通信（ S-Comm ）。该代理具有

个

命令

，

. . .

，

，被实现为

可学习的嵌入。请注意，

两轮的嵌入和两个代理不同，并且是单独学习的。

所

发送的消息是概率

，

. . .

，

（其中

选择如何在A

和

= 1）。这些问题-

.例如，可以将目标序列信息给予A

。这将对应于调

度操作员与出租车司机通信然而，这将导致大多数信

息与A

集中，并且消除了A

和A/

之间频繁双向通

信的需要。另一种设置将向A/O隐藏A

我们的初步研

究包括在这种情况下的实验，没有给A

关于

A我们根

据经验观察到，这是一个很难学习的问题，代理商未

能获得有意义的任务表现或沟通策略。我们推测这可

能部分是由于

能力是通过将置信度传递通过线性层、随后是softmax

层来获得的。在接收侧，代理通过使用概率作为权重

线性组合其词嵌入来解码这些传入消息概率，

即

，它

计算

. 类似于先前的机制，该解码的消息与信

念相关联，并且通过两个完全连接的层并跳过连接以

获得细化的信念。在早期的实验中，我们尝试使用离

散令牌而不是加权和。为了使模型可区分，我们使用

了Gumbel-Softmax技巧，但发现代理无法成功训练。

我们假设这是由于高维输入空间和数值不稳定性

剩余14页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

异构代理通信机制研究：3D环境中的协作导航任务

SOA异构系统交互指南

研究计算机网络安全体系的框架结构及其应用.pdf

移动ipv6技术及其研究现状

深度学习异构系统通信

ModelBox的特性（应用编排异构计算组件）

深度学习异构的应用实例

异构网络下的频谱感知性能分析

蜂窝与D2D异构网络资源分配的研究背景和意义

什么是异构计算系统,异构计算系统的优势

立体异构体和同分异构体区别

异构计算芯片的特点分析

异构网络中基于鸽群优化算法的d2d资源分配机制

异构图如何使用注意力机制来聚合邻居信息

知识图谱构建的参考文献

详细讨论一下第四版中同分异构体的讨论与第三版中不同的地方

基于ns2的异构网络融合仿真

多源异构数据融合技术

什么是异构感知技术集成

OPC UA可以处理数据异构问题吗

最新资源