没有合适的资源?快使用搜索试试~ 我知道了~
通用智能 Agent 对工程发展的意见和评论
工程6(2020)221意见和评论通用智能Agent卢策武a,#,王世全b,#a上海交通大学计算机科学与工程系,上海200240bB.B. Ltd.,中国上海2011051. 介绍在我们的日常生活中,我们期望智能设备帮助我们完成不同类型的任务。为此,有必要专门针对不同的任务和场景设计然而,这种方法导致智能设备的智能有限,远远低于我们的预期,无法适应不同的现实任务场景。相比之下,如果我们把人类看作“智能代理”,这样的代理,给予适当的工具,可以在各种情况下执行不同的操作任务。受这一思想的启发,我们认为需要一个通用的智能代理(GIA),这样大多数任务可以由同一个代理执行,这将大大加速智能产业的发展,增加人类生活方式的便利。我们还认为,为了接近人工通用智能的目标,一个强大而标准的GIA是必要的。本文从两个角度讨论了GIA的体系结构第一个视角是一个类人的GIA:我们希望GIA能够拥有全方位的类人感知[2]、决策[3]、知识和学习[4]。我们也希望实现一种GIA,它具有使现有知识和经验适应新情况的能力,然后驱动身体正确地实施各种操纵,从而最终完成任务。第二种观点是一个类似计算机的GIA:我们希望GIA架构的设计可以参考计算机设计的思想[5]-例如,在模块之间定义了明确的协议,模块本身可以升级,用户可以通过高级语义编程语言描述任务,而无需在系统的底层设计中投入精力。在充分考虑这两个角度后,我们提出了一个原语流模型来提取跨任务和目标对象的操作原语共性,以完成尽可能多的任务。本文提出了一种基于原语流模型的GIA,它由五个基本模块组成:执行模块、感知模块、任务编译器、知识引擎和中央GIA处理器。在本文中,我们将讨论如何将这些模块进行功能比较#这些作者对这项工作做出了同样的与人类(即,在智能方面),同时与计算机设计的概念(即,在可行性方面)。我们期望具有这种架构的GIA具有三个特征:(1) 可转移性:对于大多数任务,用户只需要提供一个简单的任务描述;没有必要改变代理或重新设计底层通用硬件,协议或操作系统。(2) 可扩展性:每个基本模块都相对独立,可以升级,就像一般计算机中的中央处理器(CPU)和随机存取存储器(RAM)一样。(3) 知识扩展:可以在众多GIA单位之间获得知识和分享经验。随着在一组GIA中完成任务的累积,知识系统将得到扩展,学习新任务所需的时间将显著减少。我们进一步讨论了如何量化智能体的智能能力。我们认为,任务可转移性是评价智能体智能能力的最重要指标。因此,我们提出了该指标可以很好地评价智能体在一般智能方面的综合能力。必须指出的是,本文中提出的GIA的概念并不打算是一个代理,可以完成所有的人类操作任务;相反,它是一个代理的概念,可以追求尽可能多的在某些场景下,根据需要,特殊机器人可以比GIA更高效,例如扫地机器人。这类似于通用计算机和专用计算机之间的关系,虽然绝大多数人使用的是通用架构的通用计算机,但特殊架构的计算机仍然需要运行某些特殊计算。在本文的其余部分,我们将介绍以下想法:GIA的基本流程模型、GIA的基本架构、基准设计、社区建设以及GIA对智能科学的影响。然后,我们将讨论GIA在各个行业中的应用。最后得出结论。https://doi.org/10.1016/j.eng.2019.12.0132095-8099/©2020 THE COMEORS.由爱思唯尔有限公司代表中国工程院和高等教育出版社有限公司出版。这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表工程杂志主页:www.elsevier.com/locate/eng222C. 卢, S. Wang /工程 6(2020)2212. 原始流模型在各种行业和日常生活中需要完成许多操作任务。GIA的核心是使用一个简单的模型来描述这些几乎无限的任务。本文提出了基元流模型的思想。基本上,任何人为操作都可以分解为多个步骤;例如,拧下螺钉的任务可以分为①抓住螺丝刀,②移动螺丝刀以与螺钉对齐,③扭转螺丝刀,以及再次移动螺丝刀远离螺钉。按照这种思路,我们探索如何将复杂的操作任务分解为几个微任务。为了阐明一个任务的分解,我们将“不能进一步分解的一般操作”定义所谓例如,拧开化学试剂瓶的盖(例如,在制药工业中)和拧开沙拉酱瓶的盖子(例如,家庭产业)。此外,可以假设人类的操纵原语集是有限的。因此,在定义了操纵原语集之后,任何人工操纵任务都可以被解析为原语流,即,作为操纵原语的序列。接下来,我们将深入讨论操作原语的完整定义和原语流的构造。2.1. 操纵基元的三个元素操纵原语的完整定义包括三个组成部分:操纵原语类型P(例如,抓取、扭转和插入);目标对象O(包括被操纵的对象和工具)的情况,其指示视觉、力和声音语义;以及目标对象在任务已经完成之后的最终状态S的集合在某些任务中,物体的最终状态有多种可能性;例如,打破玻璃可能会因此,我们将S视为一个集合,在操作原语类型P成功执行对象O上的任务后,最终状态变为集合S的成员。这些组件被称为自适应操纵原语三元组{P,O,S}的三个元素当智能体获取三元组{P,O,S}时,它激活操纵原语类型P的知识,提取对象O的状态和属性(即,外观、力感、材料、功能和启示),并执行自适应操作以实现状态S。这一过程还依赖于一个强大的知识引擎,这将在后面介绍。如上所述,我们在概念上定义了集合S,然而,从实际的角度来看,如果S太大而无法枚举,我们将设计(或训练)一个判别函数来输出指示原语是否完成的二进制状态。2.2. 基于原语的任务解析在确定了操作原语集之后,如何将目标任务解析成一系列的连续性操作,即原语流,就成为此外,GIA的环境总是动态变化的。因此,需要动态任务解析器函数Z()来根据环境变化动态地顺序选择讨论:操作原语流模型可以简化各种复杂操作任务的描述考虑到人类操作基元的有限类型,任何任务都可以转换为基元序列。同一原语操作下的操作即使在处理不同对象时也具有很强的通用性3. GIA的架构如图1所示,我们现在讨论GIA的基本模块:执行模块、感知模块、任务编译器、知识引擎和中央GIA处理器。这些模块在统一的协议下协同工作,完成各种任务,无需重新设计软硬件架构。以原语流模型为任务理解原则,我们介绍了以下五个基本模块执行模块。该部分主要由移动平台和操作平台组成。(1) 移动平台。通过移动平台的空间运动,使被操纵物体位于工作空间一个操纵平台。常见的移动平台包括轮式、四腿、双腿或带有滑轨的系统,其移动性限制和灵活性依次降低,而控制难度依次增加。如何提高机器人控制的稳定性、灵活性和效率,仍然是机器人领域的一个重要研究课题(2) 操纵台。通过对物体施加不同位置和尺寸的力,按计划实现了理想的结果。常见的操纵平台包括并联或串联类型的机器人臂及其末端执行器,以及诸如电动、气动和液压驱动的驱动方法。如何平衡准确性和灵活性Fig. 1. 建议的GIA架构有五个基本模块。C. 卢, S. Wang /工程 6(2020)221223操纵力以及操纵平台的速度、稳定性、负载和能量效率是执行模块进一步发展的关键问题。感知模块。感知模块接收外部信号,包括采集视觉信号、力信号和声音信号,同时分析环境中的视觉、力和听觉语义其中,视觉和听觉语义的分析需要计算机视觉和语音识别技术的应用。技术前景:视觉和听觉信号采集是相对成熟的技术,其中视觉信息可以包括精确的三维(3D)和热信息。目前,基于深度学习的计算机视觉技术识别训练集中不存在的对象的能力有限。如何将交互融合到环境中,提高对新对象的识别能力,也是一个开放的学术问题。 力传感器的反馈信息可以包括低频六维力(3D接触力和3D接触扭矩)信号、高频触觉信号(即,接触表面的振动状态,其可用于识别接触对象的物理和操纵状态特征),以及触觉空间信息(即,力信号的空间分布,通常由阵列和/或类图像特征形式的传感器获得)。目前,力传感器的设计和分析方法的研究仍处于发展阶段。如何以较低的成本获得更准确、更全面的力信息,以及如何将力信息与其他传感维度进行整合,也是目前的开放性学术课题。任务编译器。任务编译器是用户向GIA分配任务的接口。我们建议开发一种面向任务的高级编程语言,将用户的任务描述转换为现实世界应用程序中的原始流程。到具体地说,任务编译器负责将任务编译成可执行的动态任务解析器函数Z()。该功能可以基于由感知模块给出的信息和来自知识引擎的知识从预先构建的操纵基元库中选择当前最优操纵基元。与传统的计算机程序设计语言不同,用户除了可以通过程序编码来实现任务描述外,还可以通过演示或自然语言等多种方法来实现任务描述。一个新的科学问题将是如何描述一个任务(特别是复杂的操作任务),以便生成(或学习)一个机器可以执行的操作原语的动态任务解析器函数Z()演示是直观的,并且已经研究了很长时间[6],但通常是机器人专用的,并且成本高昂,无法记录复杂任务的每个可能的成功路径自然语言是有前途的,因为自然语言处理(NLP)技术最近取得了相当大的进展[7];然而,自然语言的开集特征阻止了语言的有效学习程序编码也需要闭集词汇表。此外,有必要考虑“机器教学”,而不仅仅是机器学习。大多数研究人员专注于机器学习,因为机器教学相对简单,因为只需要样本标记;然而,更具有挑战性的问题是如何教机器理解任务。技术前景:对于具有固定步骤的任务(例如,工业场景),我们可以直接编程操作原语序列。对于需要动态决策过程的任务,其中对于每个步骤需要关于应当使用什么类型的操纵原语的决定,方法是观察人的决策行为,采用模仿学习。在这个过程中,人类不需要大规模的试错来选择一个原始人;相反,我们依赖于对未来的基本预测知识引擎。在一个统一的协议下,不同的用户可以编辑对象和操作的知识,并可以扩展知识库。例如,微波炉制造商可以编辑他们的操作知识,并且这些知识将通过相同的协议上传到云中GIA分析任务和环境,然后访问库中相应的知识或最相似的知识集,以实现决策。开放性问题:①如何为对象操作定义对象知识协议?②如何③当知识库中没有匹配的知识时,如何依靠相似的知识进行推理?技术前景:我们希望建立一个全面的知识库,包括:(1) 基于对象属性的知识引擎。这将收集大量的3D对象信息并编辑对象属性,包括对象的每个部分的功能,启示和物理属性。目前,没有一 个 对 象 数 据 库 存 在 所 有 的 注 释 信 息 。 目 前 最 大 的 对 象 数 据 集ShapeNet[8]用对象和属性的不完整覆盖来注释一些属性。然而,如何建立一个有效的对象属性标注协议是一个关键问题.例如,在为对象属性设置空间时,对对象的理解将进一步泛化。当遇到未知物体时,通过物理交互获得物体的属性后,仍然可以很好地理解物体,然后将这些理解应用于操纵。ShapeNet无法满足此类设置(2) 一个自适应操作基元知识引擎。对于每个特定的操纵原语,在处理不同的对象时都有一定的共性,而这种共性就是跨任务。我们希望能够在同一个操作原语下提取出共同的操作知识,以便更好地完成对不同对象的操作任务具体地,对于第i个原语,给定操作对象集合O(可能包括对象、工具等),并且最终状态S,Mi输出可执行指令代理动作u以完成操纵原语,其在数学上可以写成u=Mi(O,S)。函数Mi的构造需要在引擎中结合实时力、视觉和其他感知信息以及相关应该注意的是,O的操作强烈依赖于对象属性知识。以抓取为例,我们需要知道目标物体的哪个部分可以被抓取。操纵原语的概念已经在两个流中发展:显式地(即,基于规则)[9]和隐式(即,数据驱动)[10]。传统上,显式流从未试图将所有日常操作统一起来,并专注于几个特定的小任务,例如抓取,移动和清扫[11]。很难将规则定义的原语组合成一个相当复杂的任务。相比之下,隐式流的目标是完全通过数据来学习操作模式考虑到任务拓扑的复杂性,收集所需数据的适当数量可能会令人望而却步。我们的想法与显式流密切相关,因为我们为每个原语分配了一个人类可识别的名称。(3) 任务解析知识引擎。当我们建立和改进操作基元知识引擎,224C. 卢, S. Wang /工程 6(2020)221根据任务确定操作基元的组合步骤,包括许多步骤不固定的任务。目前,人类的行为被大量的视频记录下来,因此,我们可以分析这些行为在各种环境[12]和被操纵对象下的操纵原语的顺序,从而获得任务知识引擎[13]。这可以大大提高用户使用任务编译器描述任务的效率。任务解析具有挑战性,因为任务通常可以通过不同的例程来实现。换句话说,常规任务的任务拓扑结构复杂,模型参数无法捕捉如此巨大的空间。这就是为什么数据驱动的方法对这样的问题不可行的主要原因[14]。然而,我们的操作原语知识引擎将给予任务解析问题一个强烈的优先级。中央GIA处理器。在解析任务编译器的任务之后,中央GIA处理器读取传感器模块信号并调用知识引擎中的该模块是整个系统的中心计算模块,快速接入云知识引擎,进行实时决策。该模块对计算设计提出了一定的要求。该架构具有三个理想的特征:(1) 面向任务的语义编辑。用户可以利用任务的高级编程语言,通过任务编译器向GIA发出任务描述,而不需要设计底层结构。这类似于当我们使用高级计算机编程语言时的情况;不需要设计或处理计算机CPU,内存等各种细节。(2) 标准协议下的可扩展模块控制模块、执行模块和中央GIA处理器之间有统一的操作协议和通信协议,在此协议下,硬件或软件可以独立升级。(3) 知识和经验可以增长。在建立一定的对象和知识编辑协议后,知识引擎将向所有人开放。用户可以在统一的规范下提交对象、操作基元和任务知识的知识模块,实现知识的无限增长。讨论:我们建议GIA不仅在其智能功能方面类似于人类,而且还类似于计算机的设计(表1):类似于人类。执行模块类似于人类的手和脚;感知模块可以比作眼睛、耳朵和触觉神经,它们用于从环境中感知信息;任务编译器在理解任务描述时类似于大脑中理解语言的区域;知识引擎可以比作大脑记忆区;中央GIA处理器的综合处理功能可以比作大脑中类似于电脑。计算机不能直接影响外部物理世界,因此执行模块没有相应的计算机模拟。同样,感知模块表1GIA的五个模块与人体器官(功能)和计算机模块(设计)的比较人体器官可比性计算机模块执行模块手,脚-感知模块眼睛,耳朵,触觉神经键盘,鼠标任务编译器大脑语言部分编辑器知识引擎大脑记忆部分记忆中央GIA处理器类似于计算机输入设备,如键盘和鼠标。任务编译器类似于计算机中的编译器,其允许在中央GIA处理器(类似于CPU)上执行各种程序,而知识引擎可以类似于计算机存储器。表1列出了GIA的人类和计算机模拟。4. 基准需要一个量化的指标来衡量GIA的绩效。智能可迁移性主要指学习一项新任务的成本,是通用智能水平的直接衡量标准;可迁移性也可以被视为基于深度学习的人工智能(AI)技术发展的关键瓶颈[15]。因此,我们提出AHCR作为测量指标。AHCR定义如下:对于任务A,我们有:Tagent:从用户获得任务A的描述到agent获得任务A的全部技能所需的平均时间T人:从人类学习者获得任务A因 此 , 我 们 可 以 计 算 任 务 A 的 AHCR 如 下 : AHCR=Tagent/Thuman代理也被称为ing。”在这里,平均时间是考虑到人们的时间消费偏见而使用的AHCR的主要观点是,对于智能体的任务学习与人类的任务学习的该指标能够全面地衡量智能体的一般智能能力。教学成本和学习成本是两个重要因素。①教学成本在很大程度上取决于任务编译器的成熟度。如果由于糟糕的任务编译器(例如,太多的硬编码时间),则总体教学时间将增加。在理想的情况下,我们可以使用自然语言或肢体语言来描述任务,并且Agent可以清楚地理解它。②学习成本是Agent学习所需的时间,如模型训练。应该注意的是,据估计,大多数任务都需要一个人在回路中,让用户根据反馈重新编码,这测试了智能体此外,基于学习成本,GIA的知识引擎和推理/执行能力越强大可扩展的任务动物园。由于用单个任务来评价Agent的可迁移性会存在一定的偏差,因此有必要建立一个具有足够多样性和代表性的任务动物园,以避免测量偏差。我们将使用平均AHCR来设定测量标准。我们预计,随着任务数量的增加,整体学习时间将减少。在这种情况下,一个新的学术问题将出现:什么样的任务应该是第一和应该来后,以确保学习成本最小化?例如,人类学习新事物从较容易的学习开始,然后转向更困难的学习。5. 社区和经验分享GIA的发展在很大程度上依赖于经验共享,这意味着需要大量的学术和商业团体以及有效的组织来教授GIA各种任务。我们期待以下社区的出现:感知模型社区,社区成员提交和检查各种感知模型,用于不同的目标检测器;●C. 卢, S. Wang /工程 6(2020)221225任务动物园社区(我们期望任务动物园是可扩展的),其中所有成员都可以提交新任务,并且需要一个审批委员会来检查提交的任务是否被批准;任务编译器社区,鼓励开发多种面向任务的任务编程语言,经过竞争,一些最优秀的语言获胜并被广泛使用;知识引擎社区,其中成员提交和检查各种操作原语,对象和知识。6. GIA对智能科学的影响在我们看来,GIA远远超出了人工智能机器人的概念主流深度学习方法面临的关键瓶颈是,对于新任务,未经训练的数据性能显著下降,即可移植性低。 GIA可以增强机器首先,在对世界概念的理解方面,智能体需要对其环境(特别是操作对象)的概念有深刻的理解。基于具有泛化能力的基元集,Agent通过与对象的交互,可以对物理世界有更深的理解,能够更好地表示对象的各种概念,如功能、操作模式、材料等。例如,我们通过判断一个物体是否可以通过相互作用切割事物来理解剪刀的概念。如图2所示,即使在训练集中没有提供类似的图片,人类也可以得出物体是什么的结论。相比之下,如果在预训练中不存在相关信息,则传统的学习算法无法实现此结果。GIA提供了一个与外界交互的基础,允许代理获得额外的对象属性理解;这与传统的深度学习系统不同。基于属性感知,系统还可以很好地理解看不见的对象。在操纵基元构造的辅助下,研究将从模式识别转向对象理解,从而对不可见对象具有良好的泛化能力。可扩展的群体智能。尽管这个概念已经提出了20多年,但群智能很难跨任务运行[16]。由于操纵原语在不同任务中具有很强的通用性,GIA为可扩展的群体智能提供了良好的机会。随着GIA社区创造和记录的大规模操纵,这种普遍性将进一步生成以支持任务转移。此外,委员会认为,由于地理信息系统机构有一个共同的协议,因此更容易在地理信息系统机构之间分享经验和实现更强的可移植性。此外,由于具有通用性,每个操作原语可以实现对众多智能空间的更有效的结构化索引,并在公共语义之间建立合理的连接。7. 应用GIA将显著提高工作效率,并有望为制造业、医疗、餐饮、农业和家庭用品等行业带来巨大变化。例如,目前不可能重新设计硬件、软件或学习模型来解决每个指定家庭环境中的每个新任务,这是家庭产品开发的一个关键障碍。考虑到各个领域的不同难度,GIA的实际应用将分步骤进行。表2大致总结了GIA应用的四个层次。我们认为,需要高智能水平来确定每次使用什么样的操作原语,例如在修复对象时。在知识引擎的帮助下,操作对象可以自适应地执行环境的变化。出于这个原因,我们可以在四个难度级别上建立不同应用领域的分布(图10)。 3)。但是,不能说某个具体应用程序只在一个级别上;相反,这些应用程序是跨级别的。在所考虑的GIA应用中,工业GIA处于相对简单的水平,因为在确认任务之后,操纵的对象和环境变化不大,并且操纵过程是已知的。相比之下,家庭GIA涉及与人类的互动(即,不确定对象)以及未知过程(例如,照顾老人),这增加了复杂性。因此,我们建议首先实现行业GIA应用,因为这类应用将有可能在相对较短的时间内实现。该应用程序可以作为未来通用GIA的基本原型,其他行业的子GIA可以基于该原型进行升级,最终实现跨行业通用GIA。执行模块。大部分集中装配的工人都固定在站前的位置。这种GIA的执行模块可以是一对机器人手臂,具有七个自由度(DOF)以匹配人类的灵活性。在组装复杂的零件时,人类通常依靠一种感觉,通过触摸和力来因此,臂必须能够灵活地在零件上施加不同的力和力矩组合。因此,机器人手臂应该具有高6自由度力控制性能。感知模块。对于具有高力控制性能的手臂,需要高质量的力/力矩传感器这些表2GIA应用程序的四个难度级别。水平对象和环境条件图二.如果训练集中不存在这种类型的剪刀,视觉深度学习模型就无法识别剪刀。然而,人类可以通过操纵根据其功能将物体识别为1操作的环境和对象都略有2无论是操作环境还是操作对象都有很大的3无论是环境还是操纵对象,都有很大4无论是环境还是操纵对象,都有很大已知工艺步骤已知工艺步骤已知工艺步骤未知工艺步骤●●●226C. 卢, S. Wang /工程 6(2020)221图三.不同GIA应用程序在不同难度级别上的分布。可以嵌入到臂关节中或末端执行器上。GIA还需要模仿人类的触觉和视觉,其识别对象,定位每个对象的位置和方向,并识别每个对象上的组装特征这些感觉总是需要的,以支持sophisticated实现3D视觉的一种可能方法是RGB-D相机。任务编译器。在生产线中,为了使人类工人执行其任务,需要有记录良好的标准操作程序(SOP)和工作说明书。因此,最简单的任务编译器是可以解析SOP并将其转换为正确原语序列,并从SOP中的图片中学习对象以便链接每个原语的对象的编译器。另一个,甚至更简单的,编译器可以是一个编程垫,允许现场工程编辑的原语流,因为一组原语是比较狭窄的GIA相比,其他应用程序。知识引擎。在这里,我们提出了一组所需的正常组装程序的原语,虽然这些可能不是一个完整的集合,为每一个装配任务。这一套包括:(1) 插入和/或夹持部件A并将其公/母特征滑动到部件B的母/公特征,其中可能的特征是连接器、轴/孔和螺钉/孔;(2) - 将部件A配合和/或按压在部件B的顶部上,并围绕部件A的表面移动,使得部件A和部件B的特征可以紧密公差配合在一起,其中可能的特征是通过过渡配合或压配合彼此配合的部件几何形状;(3) 将零件A拧入、车削并安装到零件B中,其中零件包括螺纹和管螺纹。工业GIA。与应用范围更广的GIA相比,应用于工业自动化的GIA将在一个相对结构化的环境中运行,并具有明确定义的程序,因此,它们的实现难度将低于其他应用中的GIA。目前,各种类型的机器人和定制设备已被用于现代生产线,以高效地制造产品,相关技术已经发展了数十年。成熟的自动化工程包括焊接,油漆,ING和材料装载。然而,仍然有一些程序只能由人类完成,这需要更复杂的材料处理,必须适应零件的合规性和组件的非完美公差控制,例如复杂的装配。在这里,我们提出了一种可能的形式的行业GIA,能够完成这些类型的任务。8. 结论在这篇文章中,我们讨论了GIA的新概念,以追求任务之间的一般可转移性。提出了一种核心原语流模型和GIA体系结构。我们相信GIA将极大地促进智能科学。引用[1] Shapiro SC,编辑。人工智能百科全书。New York:JohnWiley.[2] Wiss JF,Parmelee RA.人类对瞬时振动的感知。J Struct Div1974;100(4):773-87.[3] 奥德姆岛环境会计:能值与环境决策。New York:Wiley.[4] Studer R,Benjamins VR,Fensel D.知识工程:原理与方法。Data KnowlEng1998;25(1-2):161-97.[5] Hayes JP.计算机体系结构和组织。New York:McGraw-Hill;2002.[6] Mandlekar A , Zhu Y , Garg A , Booher J , Spero M , Tung A , et al.RoboTurk : a crowdsourcing platform for robot skill learning throughimitation.在:第二届机器人学习会议论文集; 2018年10月29日至31日;苏黎世,瑞士; 2018年。p. 879-93.[7] 张丽萍,李伟,李 伟. Bert :深 度双向 转换器 的语言 理解预 训练2018. arXiv :1810.04805。[8] Chang AX , Funkhouser T , Guibas L , Hanrahan P , Huang Q , Li Z , etal.ShapeNet:一个信息丰富的3D模型库。2015年。arXiv:1512.03012。[9] Morales A,Prats M,Sanz P,Pobil AP.使用操作基元和触觉感知进行反应性抓取的实验在:2007年机器人会议记录:科学与系统; 2007年6月27日[10] Dasari S , Ebert F , Tian S , Nair S , Bucher B , Schmeckpeper K , et al.RoboNet:large-scale multi-robot learning.在:第三届机器人学习会议论文集;2019年10月30日至11月1日;日本大坂; 2019年[11] Fang K,Zhu Y,Garg A,Kurenkoy A,Mehta V,Li FF,et al.从模拟自我监督学习任务导向的工具操作抓握。2018. arXiv:1806.09266。[12] 李永林,徐丽,刘翔,黄翔,徐勇,陈明,等. HAKE:人类活动知识引擎. 2019.arXiv:1904.06539。[13] Li YL,Zhou S,Huang X,Xu L,Ma Z,Fang HS,et al.用于人机交互检测的可传递在:2019年IEEE计算机视觉和模式识别会议论文集; 2019年6月16日[14] Xu D,Nair S,Zhu Y,Gao J,Garg A,Li FF,et al. Neural task programming:learning to generalize across hierarchical tasks. 在:2018年IEEE机器人与自动化国际会议论文集; 2018年5月21日[15] 李康Y,本吉奥Y,辛顿G. 深度学习 Nature 2015;521:436-44.[16] 肯尼迪·J·蜂群情报局。In:Zomaya AY,editor.自然启发和创新计算手册。Boston:Springer; 2006. p. 187- 219
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功