没有合适的资源?快使用搜索试试~ 我知道了~
+v:mala2255获取更多论文--自适应Poincare点集距离的少镜头分类Rongkai Ma1,Pengfei Fang2,3*,Tom Drummond4,Mehrtash Harandi1,31莫纳什大学,2澳大利亚国立大学,3DATA 61-CSIRO,澳大利亚,4墨尔本大学rongkai.ma,mehrtash.monash.edu,pengfei. anu.edu.au,tom. unimelb.edu.au摘要从有限的例子中学习和概括,少数镜头学习对于许多现实世界的视觉应用是核心重要的实现少镜头学习的主要方法是实现嵌入,其中来自不同类别的样本是独特的。最近的研究表明,通过双曲几何嵌入享有低失真的分层和结构化的数据,使其适合于少镜头学习。在本文中,我们提出学习一个上下文感知的双曲度量来表征一个点和一个与学习到的集合到集合距离相关联的集合为此,我们制定的度量作为双曲空间的切丛上的加权和,并开发了一种机制,以获得自适应的权重和星座的点的基础上。这不仅使度量局部化,而且还依赖于手头的任务,这意味着度量将根据它比较的样本我们empiri- cally表明,这种度量产生鲁棒性的存在离群值,并实现了有形的改善基线模型。这包括五个流行的少数分类基准的最新 结 果 , 即 mini-ImageNet , 分 层 ImageNet , Caltech-UCSD Birds-200-2011(CUB),CIFAR-FS和FC 100。1介绍在机器学习的现代背景下,深度神经网络(DNN)通过将标记数据的丰富可用性用于监督训练而获得了巨大的成功。尽管如此,由于获取大量标记数据的高成本,深度监督学习主要局限于对未知样本的缩放。这与人类的学习方式形成了鲜明的对比,在许多情况下,只有少数训练示例就足以概括看不见的样本。少镜头学习(FSL)通过开发可以使用有限数据进行学习的 算 法 来 解 决 这 一 关 键 问 题 ( Finn , Abbeel 和Levine2017;Nichol , Achiam 和 Schulman2018;Snell ,Swersky 和 Zemel2017;Sung 等 人 。 2018;Vinyals etal.2016;Ye et al.2020;Hong et al.2021;Wanget al. 2020年)。良好地执行FSL对于创建能够以人类的效率进行学习的*通讯作者。Copyright © 2022 , Association for the Advancement ofArtificial Intelligence(www.aaai.org). All rights reserved.(a)(b)第(1)款图1:(a):对于“红色”类中的查询样本黄色和白色圆圈)拖动原型(即,黑圈)远离嵌入空间中的真实聚类中心,使得最近邻分类器将查询点误分类为“绿色”类。(b)我们的方法计算一个自适应点来设置流形上的距离,这比原型对离群值更鲁棒。最好用彩色看。在许多情况下,FSL方法认为学习嵌入空间来区分不同类别的样本其中,嵌入空间是多维欧几里德空间,并且通过深度神经网络实现。采用双曲几何对数据进行编码已被证明是有益的,因为空间的体积会以指数方式扩展(Ganea,B e'cigneul和Hofmann 2018;Khrulko v等人2020)。最近的工作表明,视觉数据集内存在分层结构,并且双曲嵌入的使用可以产生比欧几里德嵌入显著的改进(Khrulkov et al.2020;Fang,Harandi和Petersson2021)。大多数现有的FSL解决方案通过比较查询样本和类原型之间的距离来学习度量,通常建模为每个类的平均嵌入。然而,这没有考虑异常值和噪声的不利影响(Sun et al. 2019年)的报告。这严重限制了基于嵌入的方法的表示能力,因为离群值可能会将原型拖离聚类的真正中心(见图1(a))。 对于一个更强大的方法,我们需要一个自适应的度量,它可以忠实地捕捉每个类的分布,同时对数据中的离群值和其他细微差别保持鲁棒性(图10)。1(b))。考虑到这一点,我们建议学习一个背景-arXiv:2112.01719v1 [cs.CV] 2021年12+v:mala2255获取更多论文XX⟨ ⟩ ǁ ǁ − ǁ ǁ×X1CXSSS {}ǁ ǁ}1ln(1+x),|c表示反双曲正切1我我我21−x|CCCK∈Dcc√感知双曲线度量,其表征点到集合(不)相似性。这是通过使用庞加莱球来模拟双曲空间并将gc=λc2gE,其中gE是欧几里得度量张量,λc是共形因子,定义为:λ c:=2。(一)(反)相似性作为查询和查询之间的加权和1−cx2学习自适应的类。在这样做时,每个样本(来自支持集和 查询集) 都由一 个集本身 来建模 (即 ,特 征图)。因此,我们建议利用两个集合的元素之间的成对距离,以及一种细化机制来忽略特征图中没有信息的部分这导致了一个灵活和强大的框架-由于双曲空间是一个非欧几里德空间,基本的运算,如向量加法,不能应用(因为它们不忠实于几何)。M? biusgyr向量空间为双曲空间提供了许多标准运算本文的主要内容是两个点x,y∈Dn的莫比乌斯加法,完成FSL任务。我们将我们的贡献总结为C计算为:如下所示:• 我们提出了一种新的自适应庞加莱算法。点来设置x=y(1 +2cx,y+cy2)x+(1 cx2)y1+ 2cx,y+ c2x2y2。(二更)(APP2S)FSL任务的距离度量。• 我们进一步设计了一种机制,以产生一个权重,依赖于星座的点,为我们的APP2S度量。• 我们在五个FSL基准上进行了广泛的实验,以评估所提出的方法的有效性• 我们进一步研究了我们的方法的鲁棒性,这表明我们的方法是强大的离群值相比,竞争基线。2预赛下面我们用Rn和Rm×n分别表示n维欧氏空间和m维实矩阵空间.n维双曲空间是两点x,yDn之间的测地距离可以如下获得:d(x,y)=2arctanh(c−x y)。(三)在我们的模型中使用的另一个基本操作是双曲平均。双曲空间中欧几里得平均的对应物是爱因斯坦中点,它在克莱因坐标中具有最简单的形式(双曲空间的另一个模型,它与庞加莱球等距因此,我们将点从庞加莱'(即,xD)球模型到Klein模型(即,xK)使用变换:2xxK=.(4)1+cxD2然后,Klein模型中的双曲平均被获得为:N N表示为Hn。arctanh:(−1,1)→R,arctanh(x)=HypAve(x,. . . ,x)=γx/γ,(5)功能向量和矩阵(或三维张量)用粗体小写字母和粗体大写字母其中γi=11−cxi2就是洛伦兹因子最后我们在整个文件。将坐标转换回庞加莱模型,使用:XK(六)2.1黎曼几何在本节中,我们将简要回顾一下黎曼几何。一个流形,用M表示,是一个曲面,xD= 1 +1−c<$x<$2。在我们的工作中,我们利用了Dn的切丛。对数映射定义了一个从Dn→TxDn的函数,它局部类似于欧几里得空间。切线在x∈M处的空间记为T×M。它包含了所有可能的它将庞加莱球中的一个点投影到切线在x处的空间,如:切向通过点x的向量。在指甲上-c2−xcyπ(y)= πarctanh(c−x <$y <$)。(七)C折叠,连接两点的最短路径是测地线,它的长度是用来测量Mani上的距离的,xcλc−x折2.2双曲空间双曲空间是具有常负曲率的黎曼流形,可以使用庞加莱球来研究2.3点到设置距离让 =s1,. . .,sk是一个集合。从点p到集合的距离可以以各种形式定义从点p到集合的最小和最大距离是两个简单的度量,可以定义为:模型(Ganea,Be'cigneul和Hofmann2018;Khrulko vlp2s(p; S)= inf{d(p,si)|si∈ S},(8)等人2020年)。庞加莱家族ball(Dn,gc)是光滑n-hcndp2s(p; S)= sup{d(p,si)|si∈ S},(9)通过满足Dc={x∈其中inf和sup是下确界和上确界函数,Rn:cx1,c>01,其中c是庞加莱球曲率的绝对值,而实曲率<分别从几何学的角度来看,lp2s 和值为-C。x处的黎曼度量g c定义为:hp2s 定义成对的下限和上限,1在补充材料中,我们提供了有关庞加莱球模型及其性质的DDDNi=1i=1X+v:mala2255获取更多论文进一步细节。编码关于所述集合的结构化信息所以我们在§ 3.3中,选择加权和形式来测量点和集合之间的距离。+v:mala2255获取更多论文我S{|∈}S F X}我uIJIJΣΣQ我 我uvuv如果sr≤µIJIJIJ−3方法本节将概述所提出的方法,然后详细描述我们模型中的每个组件3.1问题公式化我们遵循标准协议来制定具有情景训练的少量一个片段表示N路K-镜头分类问题(即,训练集,称为支持集,包括N个类,其中每个类具有K个示例)。顾名思义,K(即,的数量(S2S)使用距离模块f确定查询特征图与每个支持特征图之间的距离。此外,委员会认为, 使用关系分数作为相应S2S距离的权重来计算加权和,该相应S2S距离用作P2S距离。给定P2S距离,我们的网络通过最小化查询与其对应集合之间的自适应P2S距离来优化,同时确保到其他类的P2S距离(即,错误的类)被最大化。3.3自适应Poincare '点到设置距离在FSL中,我们给出了一个小的K图像支持集每个类的例子)是小的(例如,K=1或5)。目标Xs={Xs,. . .,Xs}每节课y s学习分类-学习的方法是实现一个函数F:X →Rn,i1iK i支持集被设置为潜在的并且可能是低维的空间,使得可以使用最近邻分类器来容易地识别查询样本具体地说,一个事件或任务Ei由一个查询集Xq={(Xq,yq)|I=模型。 我们使用深度神经网络首先将输入编码到多通道特征映射中,如i=(s),其中i=Si1,. . .、SiKSijRH×W×C,其中H、W和C表示实例的高度、宽度和通道大小1,. . . ,N},其中,Xi表示被采样的查询示例2,脚本(本地特征),可以进一步表示从类y q,和支持集X s ={(Xs,y s)|i =as1项硬件rRC伊伊SSij={sij,. . . ,sij|sij ∈ }。1,. . . ,N,j = 1,. . . 其中Xij表示类ys中的第j个样本。FSL的嵌入方法,我们的在我们的工作中,我们训练网络将表示嵌入庞加莱球中;因此,我们需要施加一个约束,解决办法之一是,经常将培训表述为:F:= arg min是的。F(Xq),F(Xs)均为S. t. y q= y s,Xq∈Xq(十)在每个空间位置Sr处对小块描述符的约束如下:.SR =µsr/srifsr> µ,(十一)其中δ度量查询与ij ij ij ij支持样本。3.2模型概述我们首先提供我们的方法的草图(参见图2(a)和图2(b)中的概念图)。由F表示的特征提取器网络将输入映射到超其中μ是向量的范数上界,庞加莱的球。在我们的模型中,我们选择μ=(1π)/c,其中c是庞加莱球的曲率,π是一个使系统数值稳定的小值。相同的操作应用于查询样本,从而获得查询样本的实例特征图Q={q1,. . . ,qHW},qr∈DC. P2S距离在我们的工作中,我们通过签名对支持集中的每个类进行建模它的特点是既有阶级性又有情节性-查询样本QC并且每个类S的支撑集是可以意识到,意味着如果类的样本或片段中的样本变化,则签名将变化这将使我们能够计算从查询点到每个支持类的自适应距离,同时对支持样本的排列和星座保持警惕。我们强调,我们的设计是不同于许多以前的作 品 , 类 特 定 的 原 型 学 习 FSL 。 例 如 , 在(Khrulkovetal.2020 ;Snell,Swersky,andZemel2017;Sunget al.使用Eq.(8)或Eq.(九)、然而,这两个人相遇了--Rics只决定了P2S距离的上、下界,从而在很大程度上忽略了集合的结构和分布。为了更好地利用集合中样本的分布,我们提出了自适应P2S距离度量:Kwij d(Q,Sij)dadp(Q;S):=j=1、(十二)2018),原型是特定于类的,但不一定有情节意识要获得支持集中每个类的签名,p2siK wijj=1我们将支持样本投影到查询点的切空间上,并将得到的向量馈送到签名生成器f ω。签名生成器实现了一个置换不变函数,并将其输入细化和汇总为每个类的一个签名。然后,我们利用关系网络fφ将类的样本与它们的关联签名进行对比,并产生关系得分。获得自适应P2S距离,我们首先计算一个集合到集合其中w ij是d(Q,Sij)的自适应因子。 我们在Eq中引用距离。(12)自适应庞加莱点到集(APP2S)距离。由方程式(12),我们需要计算两个特征图之间的距离(即,d(Q,Sij))。在这样做时,我们将特征图公式化为一个集合(即, {q1,. . . ,qHW},并且{s1,. . . .,sHW}),使得组到组(S2 S)距离可以2在不失一般性的情况下,我们使用每个类一个样本作为查询来表示我们的方法。在实践中,每个片段包含每个类的查询图像的多个样本。获得。单侧Hausdorff和双侧Hausdorff距离(Huttenlocher,Klanderman,andRucklidge1993)是两个广泛使用的度量集合之间距离的度量。 然而,这两个指标对S特征图。每个特征图都由一组斑块组成,F里伊+v:mala2255获取更多论文联系我们IJq'j=1IJS {}SIJΣIJ实例特征图支持Poincar球中特征映射支持切平面上的特征映射查询Poincar球中的特征映射Poincar球平均查询向量关系发生器签名生成器支持集骨干查询实例庞加莱球切映射S2S距离模块(a)(b)第(1)款图2:(a):我们方法的整体管道。给定一个情节,我们使用骨干网络提取输入并将其映射到双曲空间。然后,我们将支持样本投影到查询点的切平面上,并使用细化函数fω来获得支持集中每个类的类和episode-aware签名。这之后是一个映射fφ,它对支持集w.r.t.的每个样本的重要性进行加权。相应的类。这使我们能够计算一个自适应点,以设置推理距离(b):S2S距离模块。 我们计算两个特征图的每个特征向量之间的成对距离,作为距离网络的输入。然后,f输出S2S距离,其进一步用于计算自适应P2S。离 群 值 ( Huttenlocher , Klanderman , andRucklidge1993;Ibanez et al. 2008年)。为了缓解这个问题,我们建议通过网络函数来学习S2S距离。我们首先计算两个集合之间的成对距离D(Q,Sij)∈接收投影支持集λ= λ1,. . . .. 获得APP 2S的权重)。 我们用S=fω(S)(S={S1,. . . ,SN},RHW×HW,其中D中的每个元素由dh获得=Si={Si1,. . . ,SiK})。人们可以理解d c(qh,sw)使用等式(3),其中h=1,. . .,HW且w=1,. . . 、HW. 然后,我们使用神经网络来进一步学习两个特征图之间的距离(见图1)。(2)(b)由下式给出:通过查看所有样本来学习支持集的上下文,从而突出显示有区别的样本,并限制非信息样本,例如所有样本的离群值然后每个班级的签名ds2s(Q,Sij):= f ∈(D).(十三)与Hausdorff距离(Conci和Kubrusly2018)(见补充材料)相比,我们的集合到集合距离更灵活,并且是通过优化过程学习的。为了进一步获得APP 2S的权重(即,wij),我们利用查询样本的切空间。我们首先使用等式(1)计算特征图Q的空间维度上的平均查询向量q¯(4)-等式(六)、然后,我们使用对数映射将支持集中的样本投影到平均查询向量的切空间(见图2(a))如:S=πc(S),(14)通过总结得到:Si=KSij/K.注1我们提出的集合签名生成器f ω类似于FEAT中的集合到集合函数(Y e et al. 2020),在这个意义上,这两个功能都对输入特征执行自关注。然而,根本的区别在于,我们的模块利用了支持集中所有样本的空间特征描述之间的关系(例如, sr),而不是在FEAT中提出的原型(Y eet al. 2020年),其中,可能使模型更灵活地编码有意义的特征。Giv ensamplefeaturesinaclassSi1,. . . ,SiK和相应的类签名S′,我们使用一个关系其中,“”表示切线上的投影支撑集空间为q′。对于第i类,我们可以得到一组有限元分析.发电机(即,我图中的fφ(2)(a)比较关系真映射:S={S,. . . ,S}3.获得有意义个体特征图和类签名之间的关系i i1iK重量在这样做时,我们首先将各个特征图连接起来wij,我们首先提出了一个签名生成器,联合地细化支持集中的样本表示,并将每个类的集合表示概括为类特征。如图2(a)签名生成器重新-投影特征图也由每个空间位置Sij={s1,. . . ,sHW}以及它们沿着信道维度的类签名,以获得混合表示,如:Gij=CONC AT(Sij,Si)。(十五)给定混合表示Gij,关系生成器产生关系得分为:这个分数+v:mala2255获取更多论文SSG {GG}{S{\fnMicrosoftYaHei\fs14\bord1\shad0\3aHCC\b0}→j=1平均级联将用作等式2中的APP2S距离度量的自适应因子。(12). 注意,整个支持和支持类集合的混合表示由下式表示:=1,. . .,N且i=Gi1,. . .、GiK。算法1总结了为FSL训练我们的APP2S度量的过程。注2:设置距离的点由等式2定义。(十二)与MatchingNet 中 的 不 同 ( Vinyals et al.2016 ) 。MatchingNet将支持集中的所有样本公式化为一个集合。相比之下,我们将类中的样本视为集合,这使得我们的自适应点到集合距离完全上下文感知整个支持集(通过集合签名)并编码每个类的分布。图3:签名生成器和关系生成器的信息流签名生成器f ω将投影支持集f ω1、f ω2接收为袋,并输出每个样本的细化表示,使得每个元素(i. 例如, Sij)看到支持集的所有其他元素。然后,每个类/集合的细化表示为:都被用来获取每个类/集合S<$1和S<$2的签名。最后,我们将一个投影样本S而S4相关工作在本节中,我们将讨论关于少镜头学习的文献,并重点介绍那些激励这项工作的文献。一般来说,少样本学习文献主要有两个分支,基于优化的方法和基于度量的方法。基于优化的方法(Antoniou,Edwards,andStorkey2019;Chenetal.2019;Finn,Abbeel,andLevine2017;Flennerhagetal.2019;Franceschietal.2018;Nichol,Achiam和Schulman2018),如MAML和Reptile(Finn,Abbeel和Levine2017;Nichol,Achiam和Schulman2018),旨在学习一组初始模型参数,这些参数可以在情景机制中使用反向传播快速适应新任务,而不会出现严重的过拟合。然而,这组方法通常采用双层优化设置来优化初始参数,这在推理期间是计算昂贵的。另一方面,我们提出的方法更接近于基于度量的方法 ( Simonetal.2020;Snell , Swersky , andZemel2017;Sung et al.2018;Vinyals et al.2016;Yeetal.2020;Zhanget al. 2020;Tang等人2020),其目标是实现嵌入:RMRD以在配备有适当距离度量的语义空间中表示图像,使得不同类别是有区别的。匹配网络(Vinyalset al.2016)通过学习样本距离以及自注意机制来确定查询标签,该机制在样本上产生完全上下文化的嵌入 。 PrototypicalNetwork ( Snell , Swersky 和Zemel2017)从样本到类的度量更进了一步,其中类的所有样本都被平均到一个原型中,以表示嵌入空间中的类关系网络(Sung et al.2018)和CTM(Liet al.2019a)用网络与相应的类签名1J和2j对表示的类之间的非线性关系进行编码S1S2,重复-和查询嵌入。Ye等人(Yeet al. 2020年)并将其馈送到关系生成器f φ中以产生自适应因子ω1j和ω2j。建议采用Transformer来学习任务特定的特征,以进行少量学习。Zhang等人(Zhang et al.2020)采用地球移动器算法1:使用自适应Poincare点训练网络用于查询图像的按钮Simon等人(Simonet al. 2020年)设定距离输入:剧集E及其相关支持集Xs ={(Xs,y s)|i = 1,. . . ,N,j = 1,. . . ,K}和查询提出利用子空间生成动态分类器沿着这条研究路线,大多数以前的方法利用全局特征向量作为表示。怎么--伊日样本Xq最近的一些研究表明,利用输出:F、fω、f和fφ的最佳参数1:将Xs和Xq映射到庞加莱球2:使用等式2获得切线支撑集S。(七)局部特征图可以进一步提高性能。因此,我们遵循这些作品(Doersch,Gupta和Zisserman2020;Zhang等人2020;Wertheimer,Tang和Hariharan3:S=fω(S)d精化支撑集2021;Lifchitz et al.2019;Li et al.2019 b)来开发我们的模型。4:对于{1,...,N}do然而,上述大多数指标-5:Si=KSij/Kd集合签名基于Euclidean空间的作品采用各种度量6:Gij=CONCAT(Sij,Si)d混合表示7:ωij=fφ(Gij)d,权重8:计算点到设置距离和设置到设置距离使用等式(12)Eq. (十三)9:结束10:使用等式优化模型(十)Ganea等人(Ganea,Be' cigneul和Hofmann2018)已经证明,通过双曲几何的嵌入对于分层和结构化数据具有低失真(例如,树),并开发了前馈神经网络和递归神经网络(RNN)的双曲线版本。此外,最近的一项工作(Khrulkov et al.2020)表明,视觉任务可以在很大程度上受益于双曲嵌入,这激励我们进一步开发具有双曲几何的算法。+v:mala2255获取更多论文APP2S87双曲ProtoNet欧几里德AP2SAPP2S双曲原型网欧几里德AP2S85808275777072655实验5.1数据集在本节中,我们将通过五个标准基准对我们的方法进行 实 证 评 估 , 即 , mini-ImageNet ( RaviandLarochelle2016 ) , tiered-ImageNet ( Renetal.2018),Caltech-UCSD Birds-200-2011(CUB)(Wahet al. 2011),CIFAR-FS(Bertinetto等人,2018)和Fewshot-CIFAR 100(FC 100)(Oreshkin,L o′ pez和Lacos t e 2018)。 数据集和实施的全部细节在补充材料中描述。在下文中,我们将简要描述我们在每个数据集上的结果。5.2主要结果我们评估我们的方法为100个历元,并在每个历元中,我们从测试集中随机抽取100个任务(情节),用于5路1次和5路5次设置。遵循标准方案(Simon等人,2020),我们报告了平均准确度和95%置信区间。mini-ImageNet。 如表1所示,我们评估我们的使用ResNet-12和ResNet-18作为mini-ImageNet上其中,ResNet-12产生的结果最好。此外,我们的模型在大多数情 况下也优 于最近的 有趣的 是,我们 的模型在ResNet- 18的5路1次射击和5路5次射击中分别比双曲ProtoNet高出7.77%和7.11%。使用ResNet-12,我们在5路1次射击和5路5次射击方面分别比分层-ImageNet。我们进一步评估我们的模型分层-ImageNet 与 ResNet 骨 干 。 表 1 中 的 结 果 表 明 , 使 用ResNet-12,我们的模型在5路1次和5路5次学习方面分别比双曲ProtoNet高出4.62%和7.12%,并在归纳少次学习方面取得了最先进的结果。CIFAR-FS和FC 100。如表2中的结果所示,我们的模型在该数据集上也实现了与相关状态方法相当的性能,具有ResNet-12主干,这生动地显示了我们方法的优越性。幼童军我们使用ResNet-18作为我们的骨干来评估我们在CUB数据集上的方法。表3显示,对于5路1次和5路5次 设 置 , 我 们 的 模 型 分 别 将 性 能 提 高 了 3.94% 和4.88%。此外,我们的模型在该数据集上的5路1次拍摄和5路5次拍摄设置分别达到77.64%和90.43%,优于最先进的模型(即,DeepEMD(Zhang et al.2020)和P-transfer(Shen et al. 2021年),并在此数据集上实现具有竞争力的性能5.3对离群值的为了进一步验证我们的方法的鲁棒性,我们在存在以错误标记的图像形式的离群值的情况下进行实验。在第一项研究中,我们添加了各种数量的离群值(例如,1,2,3,4),其类与支持类不相交,支持集的每个类。我们使用ResNet-12主干在分层ImageNet上的5路5次设置上进行了这项研究。图4(a)显示双曲ProtoNet的性能显著下降。相反,我们的APP2S和Euclidean AP2S都对离群值具有鲁棒性,这表明我们的自适应度量的优越性。与欧几里德AP2S相比,APP2S甚至更鲁棒(参见图11的斜率)4(a)),并且即使在存在20个异常值的情况下也一致地执行这表明,整合我们提出的自适应度量和双曲几何可以进一步为我们的框架带来鲁棒性。在第二 项 研 究 中 ( 如 图 4 ( b ) 所 示 ) , 我 们 在 迷 你ImageNet上进行了相同的实验。结果表明,与前一个类似的趋势,这进一步证明了我们提出的方法的有效性。0510152005101520(一)(b)第(1)款图4:耐用性分析。横轴:离群值的数量纵轴:精度。(a):性能与分层的离群值数量-ImageNet。(b):mini-ImageNet上的性能与离群值的数量。5.4消融研究我们进一步进行消融研究,以验证我们方法中每个组件在使用ResNet-12主干的分层ImageNet数据集上的有效性。实验设置。 对于表4中的设置(ii),我们禁用关系模块f φ和签名生成器f ω。P2S距离可以通过等式获得(12)Eq.(13)具有相等的权重(即,①的人。此外,我们在设置(iii)中启用关系生成器fφ而不是签名生成器我们在这个实验中使用类原型而不是签名。我们启用fφ和fω,并使用欧氏距离来设置(iv)。最后,我们启用了庞加莱球,但禁用了设置(v)的f。在(v)的实现方面,主干被设计为输出特征向量而不是特征图,使得P2S距离可以通过等式(1)直接计算。(3)Eq. (12).点到设定距离的有效性。在这个实验中,我们首先通过 与 点 对 点 ( P2P ) 距 离 对 应 物 ( 即 , 双 曲 线ProtoNet)。从表4中,我们可以观察到,P2S距离可以学 习 比 P2P 距 离 更 有 区 别 的 嵌 入 空 间 ( 即 , (i)vs.(ii)),并且自适应P2S可以进一步为我们的应用带来性能增益(即,(ii)vs.(iii))。这一观察结果显示了我们在FSL任务中P2S距离设置的潜力。签名生成器的有效性。我们进一步评估我们工作中另一个重要组成部分,即,签名生成器,它细化整个支持集并为每个类生成签名如表4所示(即,(iii)及(vi)),+v:mala2255获取更多论文模型骨干迷你-ImageNet5路1次拍摄5路5次拍摄分层-ImageNet5路1次拍摄5路5次拍摄ProtoNet(Snell,Swersky和Zemel2017)ResNet-12六十37± 0。8363岁08± 0.8062岁64± 0。61六十7165岁91± 0。8264岁21± 0。7766岁12± 0。4267岁。76 ±0。4678岁02± 0.57七十五。99± 0。6078岁63± 0。46七十七。6482. 41± 0。56八十。38±0。5981岁。37±0。3382. 71± 0。3161岁。74±0。7768岁。50±0。9265岁99± 0。7266岁8771岁。16±0。87-69岁75± 0。3371岁。89±0。52八十。00±0。55八十。60±0。7181岁。56±0。5382. 6486岁。03±0. 58-83. 58± 0。4285. 96± 0。35MatchingNet(Vinyals et al. ( 2016年)ResNet-12MetaOptNet(Lee et al. ( 2019年b)ResNet-12Ravichandran等人(Ravichandran,Bhotika和Soatto2019)ResNet-12DeepEMD(Zhang et al. 2 0 2 0 年)ResNet-12P-转移(Shen et al. 2 0 2 1 年)ResNet-12GLoFA(Lu,Ye和Zhan2021)ResNet-12DMF(Xu et al. 20 2 1 年)ResNet-12Hyperbolic ProtoNet(Khrulkov等人,2020)ResNet-1260块。65±0。1876岁。13±0。2167岁。38±0。1479岁。11±0。22我们的(APP2S)ResNet-1266岁25± 0。2083. 42 ± 0。1572. 00± 0。2286岁。23 ±0。15LwoF(Gidaris和Komodakis2018)wDAE-GNN(Gidaris andKomodakis2019)LEO(Rusu et al. 2018年)Su等人(Su,Maji和Hariharan2020)AFHN(Li et al. 2020年)负余弦(Liu et al. 2 0 2 0 年)WRN-28-10WRN-28 -10ResNet-18ResNet-18ResNet-18六十06± 0.1461岁。07±0. 1561岁。76±0。0862岁38± 0。7262岁33± 0。8276岁39± 0。1176岁75± 0。11七十七。59± 0。1276岁60± 0。7078岁16± 0。56八十。94±0。59-68岁。18±0。1666岁33± 0。05---83. 09± 0.1282. 06± 0.0878岁90± 0。70-Hyperbolic ProtoNet(Khrulkov等人,2020)ResNet-1857岁。05±0.1674岁。20±0。14166. 20±0。1276岁。50±0。13我们的(APP2S)ResNet-1864岁82± 0。1281岁。31±0。22七十。83±0。1584. 15± 0。29表1:使用ResNet主干的mini-ImageNet和分层“*” notes the result obtained by the self-implemented模型骨干CIFAR-FS5路1次拍摄5路5次拍摄FC1005路1次拍摄5路5次拍摄TEAM(Qiao et al. 2019年度)ResNet-12七十。4081岁。30--ProtoNet(Snell,Swersky,andZemel2017)TA D AM(Oreshkin,L o′pez,and Lacoste 2018)DeepEMD(Zhanget al. 2020年)ResNet-12ResNet-12ResNet-1272. 20± 0。70--83. 50± 0。50--37岁50± 0。60四十10± 0。40四十六47±0。7852. 50± 0。60五十六10±0。4063岁22± 71Hyperbolic ProtoNet(Khrulkov et al. 2020年)ResNet-12* 70。27±0。22* 80。98±0。16* 36人。04±0. 18* 51。60±0。18我们的(APP2S)ResNet-12七十三。12± 0。2285. 69 ± 0。16四十七64 ±0。2163岁56 ±0。22表2:使用ResNet-12主干的CIFAR-FS和FC 100的少量分类准确度和95%置信区间。“*” notes the result obtained by theself-implemented模型5路1拍五向五射MAML(Finn,Abbeel和Levine2017)69岁96± 1。0167岁。59±1。0267岁。0272. 36± 0。90七十。2871岁。88±0。9176岁65± 0。83七十三。88± 0。8782. 70± 0。6582. 75± 0。5883. 5883. 64± 0。6086岁。3787岁42± 0。4888岁69± 0。5087岁81± 0。48Sung et al. 2018年)Chen等人(Chen et al. 2019年度)MatchingNet(Vinyals et al. (2016年)SimpleShot(Wang et al. 2019年度)ProtoNet(Snell,Swersky和Zemel2017)DeepEMD分析(Zhanget al. 2020年)P-转移酶(Shen et al. 2021年)Hyperbolic ProtoNet(Khrulkov et al. 2020年)73岁。70±0。2285美元。55±0。13我们的(APP2S)七十七。64± 0。19九十。43 ±0。18表3:CUB上的少射分类准确度和95%置信区间。“*”notes the result obtained by+v:mala2255获取更多论文设置距离的有效性。(v)和(vi)之间的比较表明,与使用特征向量直接计算APP 2S相比,我们与特征图相关联的集合到集合距离ID模型DnCP2sfφfωf分层-ImageNet5路5拍(一)(Hyperbolic ProtoNetHyperbolic P2Sw/ofφHyperbolicP2S w/fφEuclideanAP2S APP2S w/ofCcCCCCCCcCCCCcC79. 11± 0。2283. 14± 0。1784. 88± 0。1781岁。96±二)(三)(四)(五)0。1884. 12± 0。13(六)APP2SCCCCC86岁。23 ±0。15自我实现的网络ResNet-12作为主干,或者ResNet-18作为主干。我们可以观察到,我们的方法受益于签名生成器,这表明每个类的签名可以帮助为同一类内的各个特征图生成信息权重。双曲几何的有效性。我们还在欧氏空间中实现了我们的模型,以验证我们的方法的有效性。表4中的行(iv)和(vi)生动地表明,庞加莱球中的表示比欧几里得空间中的表示具有更丰富的嵌入。表4:我们的模型的消融研究,我们从双曲线ProtoNet开始(Khrulkovet al. 2020年,在APP2S?6结论在本文中,我们提出了一种新的自适应Poincare '点到集(APP2S)距离度量,用于少拍学习,它可以根据手头的样本进行自适应。经验上,我们表明,这种方法是表达与双曲几何和欧几里德对应。我们的模型改进了基线模型的性能,并在五个标准FSL基准测试中取得了竞争结果。+v:mala2255获取更多论文CCXXM关于我们厚厚阿利什卡7补充材料在本补充材料中,我们提供了Poincare 'Ball中操作的额外此外,我们进行了额外的实验,包括消融研究的曲率c的影响,全局特征向量的实现和参数和时间复杂度分析,我们的模型进行分析。最后,我们提供了
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Java集合ArrayList实现字符串管理及效果展示
- 实现2D3D相机拾取射线的关键技术
- LiveLy-公寓管理门户:创新体验与技术实现
- 易语言打造的快捷禁止程序运行小工具
- Microgateway核心:实现配置和插件的主端口转发
- 掌握Java基本操作:增删查改入门代码详解
- Apache Tomcat 7.0.109 Windows版下载指南
- Qt实现文件系统浏览器界面设计与功能开发
- ReactJS新手实验:搭建与运行教程
- 探索生成艺术:几个月创意Processing实验
- Django框架下Cisco IOx平台实战开发案例源码解析
- 在Linux环境下配置Java版VTK开发环境
- 29街网上城市公司网站系统v1.0:企业建站全面解决方案
- WordPress CMB2插件的Suggest字段类型使用教程
- TCP协议实现的Java桌面聊天客户端应用
- ANR-WatchDog: 检测Android应用无响应并报告异常
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功