没有合适的资源?快使用搜索试试~ 我知道了~
1When2com:基于通信图分组的Yen-Cheng Liu,Junjiao TianJiang,Nathaniel GlaserLiu,Zsolt Kira佐治亚理工{ycliu,jtian73,nglaser3,zkira}@ gatech.edu摘要虽然单智能体感知已经取得了重大进展,但由于覆盖范围和鲁棒性等优点,许多应用需要多个感知智能体和跨智能体通信。 因此,开发以分布式和带宽有效的方式支持多代理协作感知的框架至关重要。在本文中,我们解决了协作的捕获问题,其中一个代理需要执行一个感知任务,并可以与其他代理在同一任务上进行通信和共享信息。具体来说,我们提出了一个沟通框架,学习既要构建沟通组,并决定何时沟通。我们证明了我们的框架在两个不同的感知任务上的可推广性,并表明它显着降低了通信带宽,同时保持卓越的性能。1. 介绍单智能体感知和识别已经取得了显着的进展,其中一个或多个传感器模态用于执行对象检测[30,31,22]和分割[3,12,19],深度估计[10,38,11]以及各种其他场景理解任务。然而,在许多应用中,例如机器人,可能存在分布在环境中的多个代理,每个代理都具有本地传感器。这样的多代理系统在许多情况下是有利的,例如,以增加跨环境的覆盖或提高对故障的鲁棒性。因此,我们解决了多智能体协作感知的问题,这是文献中研究不足的主题,其中多个智能体能够交换信息以提高感知任务的整体准确性(例如,语义分割或对象识别)。多智能体协作感知的一个主要挑战是传输带宽,因为高带宽会导致网络拥塞和智能体网络中的延迟。因此,我们投资-平等贡献图1:多智能体协作感知的图示。我们构建了一个多智能体感知系统,以提高智能体感知的准确性和减少传输带宽。每个代理学习构建通信组并决定何时进行通信。在这种情况下,所有代理(以及因此传感器)的信息不能以集中的方式提供,并且代理只能通过带宽有限的信道进行通信。我们还考虑了一些具有挑战性的情况下,一些传感器数据可能是无信息或退化。先前关于学习沟通的工作[34,8]主要解决简单感知环境下此外,这些方法也不考虑带宽限制:它们学习跨完全连接的图(即所有代理通过广播彼此通信)。这样的方法不能随着试剂数量的增加而扩展。同样,由于所有信息都是广泛传播的,因此没有必要决定何时进行通信。当本地观测足以用于预测时,代理不需要消耗带宽。当其他智能体发送的信息被降级或不相关时,通信因此可能对感知任务不利。在本文中,我们提出了一个基于学习的社区,41064107请求者协作感知的阳离子模型。我们具体地将问题视为学习构建沟通组(即,每个代理决定传输什么,全连接通信群组通信与哪个(哪些)代理通信)以及决定何时通信,而无需在训练期间对这种决定进行明确的监督。与基于广播的方法(例如,TarMac [6]),并受到一般注意力机制的启发,我们的方法简化了通信的阶段,这允许不对称的消息和密钥大小,减少了传输的数据量。我们的方法可以推广到几个下游的视觉任务,包括多智能体协作语义分割(密集预测)和多智能体3D形状识别(全局预测)。我们的模型能够以端到端的方式进行训练,仅需要来自下游任务的监督(例如:用于分割的地面实况掩码和用于图像识别的类别标签),并且不需要显式地面实况通信标签。我们在不同的任务中证明,我们的方法可以对以前的作品学习沟通,同时使用更少的带宽表现良好我们提供了广泛的分析,包括消息和查询大小之间的权衡,地面实况密钥和预测消息之间的相关性,以及学习通信组的可视化。我们的贡献如下:我们解决了合作的感知,这是在感知,多智能体系统和通信的交叉点未被开发的我们提出了一个统一的框架,学习如何构建通信组和何时communicate。它在训练过程中不需要地面实况通信标签,并且可以在推理过程中动态地减小我们的模型可以推广到几个下游的任务,我们通过严格的实验表明,它可以表现得更好,与以前的作品调查学习沟通。我们提供了一个协作的多代理语义分割数据集,AirSim-MAP,其中每个代理都有自己的深度,姿态,RBG图像和语义分割掩码。该数据集使研究人员能够进一步研究多智能体感知的解决方案。2. 相关作品学会沟通。通信是有效协作的必要组成部分,特别是对于多智能体决策和感知任务。早期的工作[35,27]通过预定义的通信协议促进了信息流和协作。类似地,用于相机分组的基于拍卖的方法[21,29]使用几个假设(例如,静态摄像机)和启发式规则来决定代理的通信。但这种代理支持者图2:完全连接与组通信。完全连接的通信导致大量的带宽使用,以O(N2)的数量级增长,其中N表示网络中的代理数量。集团公司通信能够修剪不相关的连接,并且可以显著降低整体网络复杂性。刚性协议不随动态环境而发展,并且不容易推广到复杂环境。因此,近年来,一些多智能体强化学习(MARL)的作品已经探索了智能体之间的可学习的交互。例如,假设代理之间完全合作,CommNet [34]中的每个代理将其隐藏状态广播到共享通信信道,以便其他代理可以根据此集成信息决定其操作Foerster等人提出了一个类似的方案。[8],其中代理通过学习,离散信号进行通信。为了进一步利用代理之间的交互,Battaglia等人。 [2]和Hoshen [15]将核心功能集成到CommNet中。此外,一些工作已经通过递归神经网络(RNN)解决了通信问题。例如,DIAL [7]使用RNN根据每个代理的对象和来自其他代理的消息导出每个代理的单独Q值BiCNet [28]将所有代理与双向LSTM连接起来,以整合特定于代理的信息,ATOC[18]还应用了一个注意力单元来确定向共享通道广播什么。虽然几个MARL工作已经取得了实质性的进展,大多数实验任务是建立在简单的2D网格环境中,每个代理观察低维2D图像。正如Jain等人 [16]所述,在简单化的环境中研究智能体最近的工作已经提出了基于预定义的规则[18,17]或统一的通信网络[33,34,15,28,33,6]来构建通信组。通过这些技术,通信期间的带宽使用随着代理数量的增加而增加。虽然Who2com [23]使用握手通信来减少带宽使用,但该模型假设所有代理始终····4108N我Q我 Q我K我 K(a)(b)第(1)款图3:我们的(a)多请求多支持模型及其(b)握手通信(H-Com)模块。需要和其他探员联系这导致带宽消耗的浪费并且不能防止有害消息的发布。相比之下,我们提出的框架通过学习决定何时进行通信和创建通信组来解决这些问题。注意力机制。注意机制在最近的基于学习的模型中得到了广泛的应用。简而言之,注意力机制可以被视为一种软融合方案,根据相似性加权不同的值查询和键之间的相似性。一些值得注意和广泛使用的注意力机制是加法[1],规模点积[36]和一般[25]。我们工作的一个关键发现是,通用机制允许非对称查询和密钥,这使得它特别适合于考虑带宽的任务:代理发送的查询消息可以小于其保留的密钥,因此可以减少其总体带宽消耗。3. 方法我们提出的模型的目标是解决多-智能体协作感知问题, 当一个代理人同步然而,在我们的问题设置中,哪些代理被降级是未知的3.2. 传播群建设如图2所示,以前关于学习通信的工作应用了全连接通信,用于跨代理的信息交换。这种框架导致大量的带宽使用,并且当代理数量增加时难以扩展。为了降低网络复杂性和带宽使用,受通信网络协议[20]的启发,我们提出了两步组构建过程:我们首先应用握手通信[23]来确定连接的权重,并且我们进一步使用激活函数来修剪不太重要的连接。为了开始构建通信组,我们应用三级握手通信机制[23],该机制由三个阶段组成:请求、匹配和选择。Agenti首先将其本地观测值xi压缩为一个压缩查询向量µi和一个键向量κi:μ=G(x;θ)∈RQ,κ=G(x;θ)∈RK,(1)能够通过接收来自其他代理的信息来改善其感知。在本文中,我们特别感兴趣的是学习如何构建通信组,并学习何时以带宽有限的方式进行通信。3.1.问题定义和符号我们假设一个由N个代理组成的环境,每个代理都有自己的观察X={xn}n=1,.,-是的人中其中Gq是由θq参数化的查询生成器,Gk是由θk参数化的密钥生成器。我们进一步将查询广播到所有其他代理,并注意到这仅导致有限的带宽传输量,因为与高分辨率图像相比,所有查询都是紧凑的为了决定与谁通信,我们计算代理i(作为请求者)和代理j(作为支持者)之间的匹配分数mi,j代理人,其中一些是被降级的X={xl}l=1,. .,得双曲正弦值.所述分级代理的集合是所有代理X的子集mi,j=Φ(μi,κj),μi/=j,(2)X. 每个智能体输出感知任务的预测结果Y_n={y_n}n=1,.. . 、与拟议的通信机制-其中Φ(·, ·)是学习的相似性函数,其表示主义请注意,每个代理都是请求者和支持者,确保两个向量之间的相关性匹配LN4109≈我∈···N得分Mi,j意味着代理i和j之间的相关性,并且直观地,该值还表示支持代理j可以为请求代理i提供的信息量。然而,上述方法不学习“何时”通信,并且当代理具有足够的信息并且通信不是必需的时,其导致带宽浪费。一种理想的通信机制是当主体需要从其他主体获得信息以提高其感知能力时,开启传输,而当主体拥有足够的信息以完成其感知任务时,关闭传输。为此,受自我注意机制[4]的启发,我们使用来自同一代理的密钥和查询之间的相关性来确定代理是否可能需要更多信息,从而了解何时进行通信,mi,i= Φ(μi,κi).(三)注意mi,i1表示智能体具有足够的信息并且不需要通信来执行感知任务。为了最小化传输过程中的带宽使用,我们进一步提出了一种非对称消息方法,该方法将查询压缩为极低维向量(传输),同时保持用于密钥向量(其不被发送)的较大尺寸。一旦非常紧凑的查询被传递到接收器代理,我们使用缩放的一般注意力[25,36]来计算代理i和代理j之间的相关性:图4:我们构造的通信组和相应的邻接矩阵的示例。蓝色箭头表示没有带宽消耗的代理内传输,红色箭头表示有带宽消耗的代理间传输。(注)派生矩阵M可以被记为有向图的邻接矩阵,其中矩阵的条目指示何时通信,而非条目表示与谁通信,如图4所示。矩阵的每一行表示接收代理如何从不同的支持代理收集信息,并且矩阵的每一列是一个支持者如何将其自己的信息发送到不同的请求代理。如图3所示,一旦请求代理从其链接的支持代理收集信息,请求代理i就基于匹配分数将其本地观察和Φ(μi,κj)=µTWgκj√K、(四)y=D([fi;f 在f i ];θd),fint=N∑j=1m<$i,j/=0(7)我,其中WgRQ×K是匹配查询和键大小的可学习参数,Q和K分别是查询和键的维度基于上述跨所有查询和键的自注意和交叉注意机制,我们由此导出匹配矩阵M:m1, 1m 1, 2···m 1,N其中D是由θd参数化的感知任务解码器,m<$i,j是位于矩阵M<$i和j中的元素,fi=E(xi;θe)是由图像编码器E编码的代理i的真实映射,[;]是沿通道维的级联操作。值得注意的是,任务解码器不限于特定的视觉任务,我们证明了我们的通信框架可以是通用的-100m2, 1m 2, 2··· m 2,NN×N在我们的实验中,不同的视觉任务。M=σ(σ)。.. -是的-是的.)、(五)3.3.传播学mN,1mN, 2···mN,N其中σ(·)是一个反向softmax函数。为了构建通信组,我们使用激活函数修剪较少的连接:M<$=Γ(M;δ),(6)其中,Γ(;δ)是逐元素函数,其将小于δ的元素归零。 (We在我们的实验中设置δ=1我们的学习策略遵循集中式训练和分散式推理过程[24]。准确地说,所有的代理都能够访问所有的局部观察的代理在训练阶段,而每个代理只能观察自己的局部观察在推理阶段。我们的目标是学习一个带宽有效的通信机制,以便在推理阶段,我们提出的模型是能够per-form- form多智能体协作感知在带宽有限的和分布式的方式。我E∈R4110我我我··我们遵循上述握手通信来计算匹配矩阵M,并且我们基于匹配矩阵M对代理的特征图进行加权Nf al l=∑mi,jf j,(8)j=1请求代理,以及作为支持的剂.每例病例的详细信息如下所示:单请求多支持(SRMS)这第一种情况下,检查通信的有效性,为一个单一的请求代理的假设下,如果一个代理被降级,那么其原始的,非降级的信息将存在于一个支持代理。我们总共包括五个代理人,其中只有一个被选为可能的其中m位于第i行和第j行的元素降解我们随机选择50%的矩阵M.注意,在上面的等式中,mi,jfj表示与谁通信,并且mi,ifi指示何时通信。然后,客户端代理i将其自己的特征图fi和集成特征fall组合以计算下游视觉任务的预测,y_i=D([fi;f all];θd),(9)为了训练我们的模型,我们将标签用于下游任务(例如,分割掩码)作为监督,我们将损失计算为:L=H(y j,yj),(10)其中,H(i)可以是用于任何下游视觉任务的目标函数(例如,用于分割任务的逐像素交叉熵或用于识别任务的交叉熵)。我们稍后更新模型的权重Θ=(θk,θq,θe,θd)以端到端的方式使用上述损耗。4. 实验我们评估我们提出的框架的性能,工作在两个不同的感知任务:协作语义分割和多视图三维形状识别。4.1. 实验案例和数据集4.1.1协同语义分割我们的第一个任务是协作的3D场景的2D语义分割。鉴于观察(RGB图像,对齐的密集深度图,和姿势)从几个移动代理,这个任务的目标是产生一个准确的2D语义分割掩码为每个代理。由于当前的语义分割数据集[9,5,26,14]仅提供从单个代理的角度捕获的RGB图像和标签,因此我们使用AirSim模拟器[32]来收集我们的AirSim-MAP(多代 理 感 知 ) 数 据 集 。 对 于 这 个 数 据 集 , 我 们 在AirSim“CityEnviron”环境中通过一系列航点以不同的偏航率驾驶一群五到六架无人机。我们记录每个代理的姿势,深度图和RGB图像。请注意,我们还为所有无人机提供了语义分割掩码我们认为在这个任务中的三个实验情况我们将尝试分割的代理称为重新-该代理注意,仅原始代理的分段掩码被用作监督。多请求多支持(MRMS)第二种情况下考虑一个更具挑战性的问题,多个代理可能会遭受降级。这种情况不需要单个分段输出,而是需要所有代理(降级和非降级)的分段输出。我们遵循前一种情况的设置,并且我们确保几个降级请求代理中的每一个在其支持代理中具有多请求多重部分支持(MRMPS)第三种情况去除了在支持代理之间存在降级视图的干净版本的假设。相反,降级的代理必须从其他代理中选择信息量最大的视图,并且这些视图可能具有可变的相关程度。具体地,当无人机组在环境中移动时,来自每个无人机的图像周期性地并且部分地与其他无人机的图像重叠直观地,请求无人机的分割输出仅由具有重叠视图的支持无人机辅助。4.1.2多智能体三维形状分类除了语义分割任务,我们还考虑sider一个多智能体的三维形状分类任务。对于这个实验案例,我们构建了ModelNet 40数据集的多代理变体[37]。原始数据集包含来自ModelNet的40个常见对象类别,每个类别有100个然而,我们的变体向原始数据集添加了通信组结构。具体来说,我们采样三组基于类的图像三元组。每个三元组对应于随机选择的3D对象模型,并且每个三元组包含其对应对象模型的三个随机选择的2D视图为了使这个问题设置更具挑战性,我们进一步降低了每个三元组中的一个图像。该任务的目标是通过利用来自所有代理的信息来预测每个代理的相应对象类。图6显示了一项试验中9种药物的数据集示例。这个修改后的任务本质上是多视图分类的分布式版本,4111表1:关于多请求多支持和多请求多部分支持的实验结果。请注意,我们使用联合的平均交集(mIoU)度量来评估这些模型,并使用每帧MB(Mbpf)和每个代理的平均链路数来测量带宽。多请求多支持多请求多部分支持模型带宽(Mbpf /链路数)嘈杂正常Avg.带宽(Mbpf /链路数)嘈杂正常Avg.所有规范-57.8557.7457.80-47.948.3748.14CatAll2.5/5个29.0751.8340.452.0/426.8645.2736.07参加2.5/5个33.6956.2744.982.0/426.9751.0339.00完全连接。CommNet [34]2.5/5个23.6852.6738.182.0/426.5649.0737.82塔马克[6]2.5/5个51.0956.7453.922.0/429.7851.3940.59RandCom0.5/1个21.2252.7436.980.5/1个24.1345.1934.66Distri.Who2com [23]0.5/1个31.9656.1144.040.5/1个26.9750.7138.84我们0.385 /0.7756.5258.0457.280.55/1.0830.3851.2640.82OccDeg-30.0656.3143.19-25.246.7435.97全部(FC)出席人数(FC)RandCom(Distr.)Who2com(Distri.)Ours(Distr.)为自己输出。对于OccDeg,数据的降级与以前类似,而在AllNorm中,我们为所有视图使用干净的图像。这两个作为一个上限和下限的参考比较。我们还考虑将Comm-Net[34]、VAIN[15]和TarMac[6]的通信模块作为所有多输出任务的基线方法。为了进行公平的比较,我们使用ResNet18 [13]作为我们和所有提到的基线模型的功能骨干。对于3D识别任务,我们还添加了MVCNN [37]作为基线。我们用平均值来评价所有模型的性能图5:实验结果单一请求多重支持。阳离子任务[37]。4.2. 基线和评价指标在这里,我们考虑几个全连接(FC)和分布式通信(DistCom)模型作为我们的基线。FC模型融合了所有代理的观察(加权或未加权),而DistCom模型只融合了CatAll(FC)是一个朴素的FC模型基线,它在后续网络阶段之前连接所有代理的编码图像特征。视觉注意力FC)使用注意力机制来对来自支持代理的辅助视图进行加权。RandCom(DistCom)是一个朴素的分布式基线,它随机选择其他代理之一作为支持代理。Who2com[23](DistCom)排除了自我注意机制,因此它总是与支持代理之一进行通信。OccDeg和AllNorm是不使用通信的基线,即每个代理(视图)独立地com-分割任务的IoU和3D形状识别任务的预测精度。此外,我们报告带宽的所有光纤通道和DistCom型号在兆字节每帧(MBpf).为了获得MBpf,我们将需要发送给请求者的特征向量的大小和广播给所有支持者的密钥的大小相加,并乘以存储所需的字节数。4.3. 定量结果单请求多支持(SRMS)本案例的目标是检查我们的模型是否能够学习何时通信以及学习与单个请求代理通信的对象。图5显示了我们提出的模型和几个基准模型的性能。尽管与NoCom相比,大多数全连接方法可以提高预测mIoU,但它们需要以全连接的方式传播所有信息,因此需要高带宽消耗。相比之下,我们的模型报告了更高的预测精度,但带宽使用量更小(Who2com [23]:2 MBpf;我们的:0的情况。98 MBpf)。另一个观察结果是,与Who2com相比,我们的模型能够进一步改进[23]。这证明了学习何时通信的好处,这减少了带宽的浪费,并且当请求代理具有足够的信息并且不需要通信时防止有害消息。54.2453.0852.146.0944.145.0642.6838.0837.6730.8625.1225.94噪声样本正常样本AllNorm OccDegMiou·····4112表2:多智能体3D形状识别的实验结果。我们报告了退化分裂的准确性,并且所有方法对正常分裂执行类似的结果(约83%)。OccDeg所有规范RandComCatAllMVCNN [37]CommNet [34][第15话]塔马克[6]我们拆分准确度降低(%)55.0283.6654.2873.8231.8071.5275.0978.7380.72带宽(链路/MBpf)--0.11/0.891 /81 /81 /81 /81 /80.176/1.32GT盒子盒子人衣柜衣柜衣柜支持请求NoComRandComOurs化妆盒人化妆盒人人书架碗衣柜衣柜衣柜图6:支持代理和请求代理之间的二分通信图。在查询阶段,每个请求代理向所有其他代理(包括它自己)发送一个低维查询向量以建立通信。然后,在传输阶段,支持代理传输他们的高维特征表示。我们可视化了传输阶段的数据流,其中蓝色和红色箭头分别表示内部和外部通信。更突出的颜色和更大的数值表示更强的特征权重,而缺失的箭头表示通信图中修剪的链接请注意,这些图像是为了可视化目的而排序的;实际的数据集是无序的,每个代理都观察到一个随机的类,具有随机的退化机会。多请求多支持(MRMS)在在这种情况下,我们进一步解决了一个更具挑战性的问题,其中多个代理遭受退化。每个代理应该(1)确定何时需要通信,(2)决定何时与谁通信,以及(3)避免选择支持代理的噪声视图。我们将实验结果列于表1。可以看出,当请求代理不能阻止选择嘈杂的支持代理时,CatAll和RandCom的表现甚至比NoCom更差。这验证了我们的直觉,即来自支持代理的信息并不总是对请求代理有利,并且选择不正确的信息甚至可能阻碍请求者的预测。通过使用注意力机制来对来自支持代理的特征图进行加权,WARNATTEND和Who2com[23]都能够防止不正确的视图降低性能,从而改善NoCom,CatAll和RandCom。然而,在不学习何时通信的情况下,这些模型被迫总是从至少一个支持代理请求信息,从而导致性能较差和不必要的带宽使用。除了上述基线方法外,我们还考虑了CommNet [34]和TarMac [6]。即使Comm-Net通过使用平均池化机制,它不改进降级或非降级请求代理的预测,因为它不加区别地合并所有视图。另一方面,与基线模型相比,TarMac [6]能够提供更好的结果。然而,TarMac使用单向通信并导致大带宽使用,这在实际应用中存在困难。相反,我们的模型不仅能够在退化和非退化样本上表现出色,而且通过使用我们的非对称查询机制和使用激活函数修剪网络内的冗余连接,消耗更少的带宽。多请求多重部分支持(MRMPS)在这种情况下,在任何两个代理之间具有完全重叠的观察结果的机会较小。这在感知任务中提出了固有的困难,因为只有不完整的信息可用于预测。如表1的右侧部分所示,所有FC和DistCom模型的性能改进幅度相对于NoCom较小,而在前面的场景中观察到的改进更为显著。尽管如此,我们观察到所有方法都表现出与前一种情况相似的趋势。我们的模型仍然能够保持与完全连接模型相似的预测准确性,而我们只使用四分之一的带宽用于com。0.9980.6840.6890.2754113质量保证 再认确认科目(%)精度1009090百分百8070%7040%握手通信的效果99.80%98.27%80 601 4 16 64查询大小百分之十WhenToCom图7:不同查询大小的消融研究。代理之间的通信。这证明了我们的模型的优越的带宽效率。多智能体三维形状识别为了证明我们的模型的推广,在这里,我们将我们的模型应用到多智能体三维形状分类的任务。表2提供了使用我们提出的模型和其他基线(包括VAIN[15],CommNet[34]和TarMac[6])对该任务的定量评估。 与TarMac[6]相比,我们的模型能够在仅使用约八分之一带宽的情况下具有竞争力我们还在图6中提供了定性结果,以证明我们的模型的有效性,该模型允许代理与正确和信息代理进行通信。4.4. 分析为了调查我们的模型相对于基线的改进的来源WhenToCom准确性衡量请求者和支持者之间建立通信的频率以及何时需要通信;并且当确实存在通信时,测量正确的组被创建的频率。我们还评论之间的权衡带宽和性能的通信进行控制实验的大小上的查询和关键的3D识别数据集。握手效应通信作为如图8所示,我们对提议的握手通信进行消融研究。在Ours(w/o H-Com)模型中,我们删除了握手通信模块,因此每个代理仅使用其本地观察来计算(1)通信得分和(2)其通信组。我们还提供了RandCom的结果。我们观察到,我们的模型与建议的握手通信提供了一个显着的改进,无论是兰德公司和我们的模型没有握手通信。这一发现表明了沟通对于决定何时沟通和与谁沟通的必要性。也就是说,没有通信的代理不能决定它需要什么信息,以及哪个支持者有相关信息来帮助更好地执行搜索任务。图8:我们提出的H-Com的效果。握手通信显著提高了通信精度。图6显示了来自3D形状识别任务的三个示例。每个代理都清楚地知道什么时候需要基于支持者提供的信息和自己的观察进行通信。例如,在前三个框示例中,左侧的降级代理知道从其他代理选择信息视图;中间的未降级代理决定选择信息量更大的视图,即使它拥有足够的信息;并且第三代理决定不需要通信,因为它在所有视图中具有最多的信息。 值得一提的是,所有9个视图都提供了并且代理需要基于匹配分数来识别信息视图和有害视图。查询和关键字大小我们进一步分析了查询和关键字大小对三维形状分类任务的查询准确率和分类准确率我们将查询大小从1变化到128,键大小固定为16,如图7所示。我们观察到,选择和分类精度提高的消息大小的增加。我们的模型可以在消息大小为4的情况下表现良好。关键尺寸也观察到相同的趋势。最值得注意的是,我们发现存在查询键大小的不对称性。虽然选择精度在16维查询时饱和,但选择精度随着键大小的增加而不断提高,直到1024维键。我们的模型利用这种不对称性来节省通信带宽,同时保持高性能。4.5. 结论在本文中,我们提出了一个通用的带宽效率的通信框架的协作感知。我们的框架学习如何构建通信组以及何时进行通信。该框架可以推广到几个下游任务,包括(但不限于)多智能体语义分割和多智能体3D形状识别。我们证明了supere- rior的性能与较低的带宽要求在所有比较的方法。5. 确认这项工作得到了ONR资助N 00014 -18-1- 2829的支持。48.46%33.84%百分之十九点46.73%质量保证(%)RandCom Ours(w/oH-Com)Ours(w/H-Com)4114引用[1] Dzmitry Bahdanau,KyungHyun Cho,and YoonyBengio.神经机器翻译通过联合学习对齐和翻译。国际学习代表会议(ICLR),2015年。3[2] 彼得 巴塔利亚Razvan 帕斯卡努 马修 Lai,DaniloJimenez Rezende,等. 交互网络,用于学习物体,关系和物理。神经信息处理系统(NIPS)的优势,2016年。2[3] Liang-Chieh Chen,Yukun Zhu,George Papandreou,Florian Schroff,and Hartwig Adam.用于语义图像分割的具有粗糙可分离卷积的编码器-解码器。在欧洲计算机视觉会议(ECCV)的会议记录中,第801-818页,2018年。1[4] 程建鹏、李东、米瑞拉·拉帕塔。机器阅读的长短期记忆网络。自然语言处理中的经验方法,2016年。4[5] Marius Cordts , Mohamed Omran , Sebastian Ramos ,Timo Rehfeld,Markus Enzweiler,Rodrigo Benenson,Uwe Franke,Stefan Roth,and Bernt Schiele.用于语义城市场景理解的cityscapes数据集在IEEE计算机视觉和模式识别会议(CVPR)的论文集中,第3213-3223页,2016年5[6] AbhishekDas , The' ophileGerv et , JoshuaRomof f ,DhruvBa-tra,Devi Parikh,Michael Rabbat,and JoellePineau.目标多智能体通讯.在2019年国际机器学习会议(ICML)上。二、六、七、八[7] Jakob Foerster , Ioannis Alexandros Assael , Nando deFreitas,and Shimon Whiteson.学习与深度多智能体强化学习进行通信。神经信息处理系统进展(NIPS),2016年。2[8] Jakob Foerster,Yannis M Assael,Nando de Freitas,andShi-mon Whiteson.学习与深度多智能体强化学习进行交流。在神经信息处理系统(NIPS)的进展,2016年。一、二[9] Andreas Geiger , Philip Lenz , Christoph Stiller , andRaquel Urtasun.视觉与机器人技术的结合:Kitti数据集。The InternationalJournal of Robotics Research ,32(11):1231-1237,2013. 5[10] Cle' mentGodard,OisinMacAodha,andGabri elJBros-tow.具有左右一致性的无监督单目深度估计。在IEEE计算机视觉和模式识别会议论文集,第270-279页1[11] Cle' mentGodard , OisinMacAodha , MichaelFirman ,andGabriel J Brostow.深入研究自我监督的单目深度估计。在IEEE计算机视觉国际会议论文集,第3828-3838页,2019年。1[12] 何凯明、乔治亚·吉克萨里、彼得·多勒和罗斯·吉尔希克 。 面 具 R-CNN 。 在 IEEE 计 算 机 视 觉 国 际 会 议(ICCV)的会议记录中,2017年10月。1[13] Kaiming He,Xiangyu Zhang,Shaoying Ren,and JianSun.用于图像识别的深度残差学习。进行中-IEEE计算机视觉与模式识别会议(CVPR),2016年。6[14] Simon Hecker,Dengxin Dai,and Luc Van Gool.使用全景摄像头和路线规划器进行驾驶模型的端到端学习。在欧洲计算机视觉会议(ECCV)的会议记录中,第435-453页,2018年。5[15] Yedid Hoshen Vain : Attentional Multi-Agent PredictiveModeling. 神经信息处理系统进展(NIPS),2017年。二、六、七、八[16] Unnat Jain , Luca Weihs , Eric Kolve , MohammadRastegari,Svetlana Lazebnik,Ali Farhadi,Alexander GSchwing,and Aniruddha Kembhavi.两体问题:协作视觉任 务完 成。在IEEE计算 机视 觉和模 式识 别会议(CVPR)的会议记录中,2019年。2[17] 姜杰川,陈敦,陆宗庆。图卷积强化学习多智能体合作。arXiv预印本arXiv:1810.09202,2018。2[18] 蒋洁川和卢宗庆。学习多智能体合作的在神经信息处理系统(NIPS)的进展,2018年。2[19] Alexander Kirillov 、 Kaiming He 、 Ross Girshick 、Carsten Rothe r和PiotrDol la'r。 全视节段在IEEE计算机视觉和模式识别会议(CVPR)的主席,第9404-9413页1[20] 詹姆斯·黑濑计算机联网:一个自上而下的方法,具有互联网,3/E。Pearson Education India,2005. 3[21] 李一鸣、比尔巴努和魏林。摄像机主动控制拍卖协议。在IEEE图像处理国际会议(ICIP)中,第4325IEEE,2010。2[22] Tsung-Yi Lin , Priya Goyal , Ross Girshick , KaimingHe,and Piotr Dollar.用于密集对象检测的焦点损失。在IEEE国际计算机视觉会议(ICCV)的会议记录中,2017年10月。1[23] Yen-Cheng Liu,Junjiao Tian,Chih-Yao Ma,NathanielGlaser,Chia-Wen Kuo,and Zsolt Kira. Who2com:通过可学习的握手通信实现协作感知。IEEE机器人与自动化国际会议(ICRA),2020年。二三六七[24] Ryan Lowe,Yi Wu,Aviv Tamar,Jean Harb,OpenAIPieter Abbeel,and Igor Mordatch.混合合作竞争环境下的多智能体行动者-批评者。神经信息处理系统进展(NIPS),2017年。4[25] Minh-ThangLuong 、 HieuPham 和 ChristopherDManning。基于注意力的神经机器翻译的有效方法自然语言处理经验方法会议(EMNLP),2015年。三、四[26] 威尔·马登,杰夫·帕斯科,克里斯·里尼格,还有保罗·纽曼. 1年,1000公里:牛津RobotCar数据集。TheInternational Journal of Robotics Research(IJRR),36(1):35[27] Francisco S Melo , Matthijs TJ Spaan , and Stefan JWitwicki.Querypomdp:多代理系统中基于Pomdp的通信。2011年第9届欧洲多智能体系统会议论文集。24115[28] Peng Peng,Ying Wen,Yaodong Yang,Quan Yuan,Zhenkun Tang,Haitao Long,and Jun Wang.多智能体双向协调网络:在学习玩星际争霸战斗游戏时出现人类水平的协调。arXiv预印本arXiv:1703.10069,2017。2[29] 费萨尔·库雷希和德米特里·特佐普洛斯 虚拟现实中的智能摄像机时代的网络。Proceedings of the IEEE,96(10):1640-1656,2008. 2[30] Joseph Redmon,Santosh Divvala,Ross Girshick,andAli Farhadi.你只看一次:统一的实时对象检测。在IEEE计算机视觉和模式识别会议(CVPR)的会议记录中,第779- 788页,2016年。1[31] 约瑟夫·雷德蒙和阿里·法哈迪Yolo9000:更好、更快、更强。在IEEE计算机视觉和模式识别会议(CVPR)上,2017年7月。1[32] Shital Shah 、 Debadeepta Dey 、 Chris Lovett 和 AshishKapoor。Airsim:用于自动驾驶车辆的高保真视觉和物理模拟。在现场和服务机器人,2017年。5[33] Amanpreet Singh、Tushar Jain和Sainbayar Sukhbaatar。学习何时进行大规模沟通,多智能体合作和竞争任务。arXiv预印本arXiv:1812.09755,2018。2[34] Sainbayar Sukhbaatar,Rob Fergus,et al.用反向传播学习多智能体通信。神经信息处理系统进展(NIPS),2016年。一二六七八[35] 谭明。多智能体强化学习:独立与合作代理商。在1993年的国际机器学习会议(ICML)上。2[36] Ashish Vaswani, Noam Shazeer , Niki Parmar , JakobUszko-reit , Llion Jones , Aidan N Gomez , ukaszKaiser,and Illia Polosukhin.注意力是你所需要的神经信息处理系统进展,2017年。三、四[37] 吴 志 荣 , 宋 舒 然 , Aditya Khosl
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Python和Opencv的车牌识别系统实现
- 我的代码小部件库:统计、MySQL操作与树结构功能
- React初学者入门指南:快速构建并部署你的第一个应用
- Oddish:夜潜CSGO皮肤,智能爬虫技术解析
- 利用REST HaProxy实现haproxy.cfg配置的HTTP接口化
- LeetCode用例构造实践:CMake和GoogleTest的应用
- 快速搭建vulhub靶场:简化docker-compose与vulhub-master下载
- 天秤座术语表:glossariolibras项目安装与使用指南
- 从Vercel到Firebase的全栈Amazon克隆项目指南
- ANU PK大楼Studio 1的3D声效和Ambisonic技术体验
- C#实现的鼠标事件功能演示
- 掌握DP-10:LeetCode超级掉蛋与爆破气球
- C与SDL开发的游戏如何编译至WebAssembly平台
- CastorDOC开源应用程序:文档管理功能与Alfresco集成
- LeetCode用例构造与计算机科学基础:数据结构与设计模式
- 通过travis-nightly-builder实现自动化API与Rake任务构建
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功