没有合适的资源?快使用搜索试试~ 我知道了~
基于双曲边信息学习的广义开集识别
4003祖先搜索:基于双曲边信息学习的广义开集识别希文登雄罗彻斯特理工学院计算与信息sd6384@rit.edu孔玉密歇根州立大学计算机科学与工程系yukong@msu.edu摘要与开集识别不同,广义开集识别利用已知类样本和已知类的边信息,对未知样本学习最相似的已知类。现有文献中,特征嵌入到欧氏空间时,会使具有高度结构的边信息失真,从而导致难以识别未知样本。本文提出了一种基于双曲空间的广义开集识别的边信息学习算法,以减轻识别过程中的失真,准确识别未知样本。具体来说,我们提出了一个双曲边信息学习框架来识别未知样本,并提出了一个祖先搜索算法来从选定的已知类的分类中搜索最相似的祖先。在CUB-200和AWA 2数据集上的实验表明,该方法大大提高了广义开集识别的性能。1. 介绍广义开集识别(GOSR)是一个重要的计算机视觉问题,它识别未知类1并基于已知类2的辅助信息(如分类法和属性注释)识别新类别[16]。与简单地将新样本拒绝为未知的开集识别[41,7,8,44]不同,广义开集识别进一步对超类进行分类[25]。例如,在图1中,GOSR基于树结构分类信息将未知动物(豹)识别为猫科动物或猫科动物,而不是简单地这是有益的,如果一个系统能够提供更多的信息,关于看不见的样本,使我们可以有一个更好的联合国,1未知类是指在训练过程中没有信息的类。2已知类是指训练中给出的类。图1.广义开集识别进一步分类未知样本的基础上的边信息(分类法)。广义开集识别的目标是从祖先节点中找到最接近的未知样本。不知名的动物豹是一种新奇的猫科动物。在GOSR问题中,认为豹是新的胎盘是部分正确的,其他预测是错误的。了解未知的样品。GOSR是一个具有挑战性的问题,因为现有方法无法有效捕获未知样本的变异性[25]。在GOSR问题中,不提供未知类的训练样本,仅从已知训练样本中捕获未知样本的变化性[25]会降低分类器的识别能力。尽管GOSR问题中存在辅助信息(包括分类法和属性注释),但在现有的欧几里得分类器中直接嵌入辅助信息[25]可能会导致细粒度类的高度失真此外,随着分类层次的加深,分类器中的类数呈指数增长,这影响了现有方法的识别能力。因此,如何有效地学习边信息是识别未知样本的关键。为了有效地学习边信息,提出了一种在双曲空间中生成新的属性特征的边信息学习方法和一种在已知类的分类中搜索最近祖先节点的搜索算法.超曲空间是一个非欧空间,它的空间容量呈指数增长。根据其几何性质犬狗Taxonomy?未知已知类别奇瓦瓦达尔马提亚暹罗猫波斯猫胎盘地面实况分类法新型胎盘素小说猫猫猫4004[30] 双曲空间可以看作是一棵连续树,树结构的边信息可以以最小的失真嵌入到双曲空间中[17]。在双曲空间中生成新的属性特征可以更好地捕捉未知样本的变异性。具体来说,我们首先提出双曲占位符留出一个大面积的未知样本和一个在双曲空间中的属性生成器,以生成新的属性未知的样本。然后,我们提出了一种新的属性生成器生成新的属性特征的基础上选择的属性特征从已知的类。此外,我们提出了一个祖先节点的搜索算法,以识别未知的相似已知类的分类与现有的GOSR工作[25]相比,我们的新属性特征生成器更好地捕获了未知类的可变性。与现有的基于欧几里得的开集识别工作[44]相比,我们的超曲占位符更具代表性,可以从已知类中学习边信息,从而实现未知样本的分类识别。与无法进一步识别未知祖先的生成方法[21]相比,我们的祖先搜索框架可以实现这一点,并且优于[35,3],因为我们的方法通过双曲空间中的属性生成器和相似性此外,我们开发了层次相似性指数来评估GOSR问题的已知和未知样本之间的相似性,因为现有的开集评估度量没有考虑预测结果的层次距离。我们的贡献总结如下:• 我们提出了一个双曲边信息学习框架,更好地捕捉未知样本的变化。• 我们提出了一个祖先搜索算法,通过树结构的分类识别看不见的类。• 我们提出了新的措施来评估GOSR问题,实证结果表明,我们的方法的优越性,以国家的最先进的。2. 相关工作广义开集识别GOSR在没有先验知识的情况下检测与代表性训练数据显著不同的测试样本。GOSR可以使用来自训练类的边信息(分类学中的语义信息)。以前的一些对象识别工作将分层分类法的分类任务。音乐流派分类工作[35]利用分层数据检测小说类。Zhao[43]在开集场景解析框架中使用层次结构估计预测标签和地面实况。类似于GOSR问题,Mancini [27]提出了一个开放世界的组成框架,在零次学习场景下使用属性注释来识别未见过的样本。基于属性标注的合成框架首先从图像中提取概念,并根据概念生成新的图像。与开放世界组合框架不同,GOSR框架只需要来自已知类的辅助信息零射击学习框架不能在没有来自未知类的辅助信息的情况下对未知类进行分类。 我们的任务类似于小说侦探-”[25]中的一句话。即使所提出的方法考虑了层次关系,在剔除看不见的样本,自顶向下和扁平的方法,[25] 不会扩大已知类和未知类之间的差距与另一个识别工作[3]相比,当未知类的概率与它们的假设不同时,层次杠杆方法不起作用。开集识别中的先驱工作[2]通过添加Weibull分布拟合分数来计算不可见类的伪激活,从而取代Softmax层。判别式模型和生成式模型是现代开集识别模型的两大主流。一些应用[10,19,34,32,1]已经在图像,视频和文本识别领域中应用了判别模型。此外,分类-重构学习算法[40]提高了未知类分类的鲁棒性,减少了已知类的误分类。生成模型通过提供更多生成的不可见样本来改进开集识别任务[14,41,15,44]。Zhou等[44]在他们提出的方法中结合了判别和生成部分。第一部分是学习一个多阈值模式来分类已知和未知。在第二部分中,该模型通过随机混合来自两个不同已知类别的样本,从已知类别生成未见过的图像与[44]相比,我们的方法将占位符嵌入到双曲空间中,并使用两个已知类之间的距离来确定属性特征生成过程。我们还开发了一种方法来生成未知对象的新属性。为了减轻历史类嵌入的失真,在早期的开创性文献[37,4]中开发了黎曼优化在黎曼最优化之后,研究人员利用古老的双曲几何自然地解决了这类问题。庞加莱球模型[36]使用双曲蕴涵锥嵌入了层次关系。基于庞加莱球模型,Nickelet al. [30]将树结构投影到磁盘上,提出了Poincare磁盘模型。4005网络(祖先节点移除((L)*新的属性DNN2016年10月24日,+欧氏空间重新标(d)其他事项双曲线占位符和新属性生成器已知类吉娃娃波斯猫达尔马提吉娃娃暹罗猫占位符属性波斯猫达尔马提暹罗猫已知类别B,>100提取属性+属性注释布朗布朗毛茸A类属性爪子…灰色毛茸…新的属性双曲空间边界双曲空间边界猫狗猫犬食肉动物TaxonomySelect胎盘·N·N·N(a)(b)第(1)款(c)第(1)款输入:边信息+闭集分类器双曲边信息学习祖先搜索算法胎盘食肉动物Taxonomy犬狗猫猫达尔马提亚吉娃娃波斯猫暹罗猫图2.GOSR的总体框架在a部分,输入是已知的样本和辅助信息(分类法+属性注释)。在(b)中,通过双曲边信息学习过程来训练神经网络工作H_∞()。分类法用于重新标记图像,属性注释用于提取属性特征(黄点)。(d)说明了双曲占位符学习的细节,新的属性生成方法。在祖先搜索算法部分(c)中,祖先搜索损失被设计为训练模型()以识别未见过的样本。Poincare盘模型在层次结构数据中学习更好的表示,因此基于双曲线的模型用于解决自然语言处理问题[11,12]。之后,Ganeaet al. [13]进一步提出了基于双曲几何的前馈神经网络和递归神经此外,使用双曲几何特征提出了图卷积网络[6]此外,双曲线嵌入方法在其他具有层次结构的任务中也有广泛的应用。Chami等人[5]嵌入了一个基于庞加莱磁盘模型的知识图。在视频预测中,与少量学习中的双曲线嵌入相比[20,9],分类等不可见类的辅助信息在我们的任务中不可用。双曲空间中的特征表示将帮助我们使用已知类的分类法。与zero-shot学习中的双曲视觉嵌入[26]相比,我们的方法不使用大型文本语料库来生成关键词。3. 方法本节说明了所提出的框架如何识别不可见的样本。图2(a)介绍了GOSR的输入,包括分类法、已知样本和属性注释。已知样本是已知类的训练样本。为了更好地描述框架,我们将已知类定义为叶类,已知类的祖先是非叶类。图2(b)示出了双曲边信息学习过程。为了更好地识别未知样本,我们提出了祖先搜索样品培训+边信息双曲线占位符一种新颖的属性生成器删除祖先节点测试吉吉分类选择牧羊i(i)���≤��� ℎ小说狗DNN���联系我们已知类图3.在训练过程中,通过新的属性生成器生成n个属性特征。分类选择和祖先节点删除过程用于训练深度神经网络()。在测试过程中,利用阈值th来区分已知和未知.如果输出概率p th,N(·)将把未见过的样本分类为新狗。图2(c)中的算法。图2(d)提供了双曲边信息学习的细节,包括双曲占位符学习和新属性特征生成器。培训和测试。在我们提出的框架中,双曲网络工作H()和深度神经网络工作()可训练以识别未知样本。图3显示了培训和测试的工作流程。在测试中,我们首先提取输入图像的特征为x,例如,牧羊犬然后,我们通过指数映射将特征映射到双曲空间,例如,E(x)。取最大4006N·ΣN·\--∈--ΣΣ∈ΣΣ已知类别的输出概率,即, p=maxH(x)。 如果p >t h,其中t h是叶类的阈值,则图像被分类为采用y=argmaxH(x)标签的已知类。否则,我们使用双曲嵌入E(x)作为网络()的输入,并搜索x的最近祖先。培训过程稍微在新的属性生成过程中,将叶类样本和生成样本分离。图2(d)示出了双曲线占位符。训练集Dtrain上的双曲线占位符损失被示为与测试过程不同在双曲边信息学习部分,新的属性特征仅Lhp=(x,y)∈D列(H在培训过程中产生的。此外,我们使用生成的属性特征来训练分类选择和祖先节点删除后的深度神经网络()过程3.1. 双曲边信息学习现实世界中的分类法和属性注释自然是分层的。在本节中,我们设计了一个双曲空间中的占位符学习过程来学习边信息,因为税收中的节点数量在分层结构中呈指数增长。此外,在GOSR问题的训练过程中不能使用未知样本提出了一种新的基于属性标注的属性特征生成器,用于捕捉未知样本的变异性。双曲线占位符。占位符代表为非叶类留出的区域。我们提出双曲线占位符进一步分类非叶类其中,Y1表示交叉熵损失,yY1表示叶类的标签,并且Y1= 1,2,. . .、K. H*(x)y表示通过设置WE(x)为0。β是控制未知样本丢失的参数。对于GOSR问题,所有训练样本都被标记为叶类。基于闭集分类器的非叶类分类仍然是一个具有挑战性的问题。解决这个问题的一个简单方法是将一些叶类样本重新标记为非叶类[25]。具体地,使用分类信息将图像特征的一部分(r)重新标记到它们的祖先节点例如,在(图2(b))中,吉娃娃图像可以随机重新标记为以下非叶类之一:狗,犬科动物,食肉动物和pla-cental。我们将Y表示为K个叶类Y1和L个非叶类的集合,即, Y = 1,2,. . . 、K、K +1、. . . 、K+L。然后,我们定义一个重新标记的损失给定的新标签K+L基于欧氏空间中的闭集分类器。给定闭集分类器,矩阵W=L重新标记=−x∈D序列tilogH(x)i,(2)i=1[w1,. . .是分类器的最后一个线性层的权重,K是叶类(已知类)的数量。我们使用指数映射将已知类的闭集分类器转换到双曲空间[31]。假设E(x)是从欧几里得空间到双曲空间的指数映射变换,x是由宽残差网络提取的特征[42]。双曲空间中所有叶类的输出logit为h=WE(x)。为了能够识别已知和未知的类,我们引入了双曲线占位符对不属于已知类别的样本进行分类。双曲占位符的输出矩阵为hp=WE(x),wE(x),其中wE表示用于对双曲占位符进行分类的增广参数。与占位符学习不同[44],我们定义双曲占位符的数量为L,其中L表示非叶类的数量。输出的大小为K+L。前K个输出表示叶类,后L个输出表示非叶类。双曲神经网络的输出概率是softmax函数的归一化logits,即,H∞(x)=so ftmax(hp)。与[44]类似,我们提出了一个双曲线占位符过程的损失函数,其中ti是实值标签y的独热向量的第i个元素,并且x是输入特征。重标记丢失使双曲线占位符能够分隔非叶类。新颖的属性特征生成器。在我们的框架中,最具挑战性的部分是如何在双曲空间中分离祖先节点。基于来自叶类的属性生成新属性有助于框架捕获非叶类的可变性并实现非叶类中的进一步分类能力。属性表示图像样本的标签。受欧几里德占位符学习方法[44]和开放世界组合方法[27]的启发,我们引入了双曲相似性约束和莫比乌斯变换来生成新的属性特征。由于现实世界中的未知样本在某种程度上与已知样本共享相似的属性[27],因此我们可以通过基于其在双曲空间中的相似性组合叶类属性特征来生成噪声较小的新属性特征。生成的相似性约束减轻了叶类的任意组合,这在开放世界中永远不会存在从形式上讲,4007·N·−·⟨··⟩⊗ ⊕ −⊗̸Σ·}̸BLL不···ia⊕⊗JBρ(f;i,j)BF国际联合会国际联合会Taxonomy SelectXiangjiang(删除祖先节点新的属性(初始预测祖先(L新的属性DNN2016年10犬小说食肉动物狗狗猫一种新型狗犬犬猫犬新型食肉动物食肉动物食肉动物食肉动物新型胎盘素胎盘胎盘胎盘胎盘胎盘图4. 祖先搜索算法。 输入是novelattri butetagf,潜在的地面实况分类Ttagi。 H()表示双曲边信息学习中的分类器。 初始潜在祖先ni=argmaxH (f)。 所选分类Ti由Ti和ni确定。在此基础上,设计了一个祖先节点迁移过程和一个祖先搜索损失量来训练模型()识别看不见的样品我们将f(A)和f(B)定义为第i个样本的特征。对于没有属性注释的数据集,我们使用一个参数,国际联合会xi和属性b上的来自B类的第j个样本xj的特征,它们的双曲相似性P(f(A),f(B))由下式测量:P(u,v)=<$E(u),E(v)<$(3)E(u),E(u)哪里 、表示Minkowski内积, E()是将特征从欧几里得空间转换到双曲空间的指数映射。而且参数λi作为叶类yi的置信度得分,并将叶类yj的置信度得分定义为1无属性注释的数据集中的λ i。一种新的无属性标注数据集特征生成方法其中f=λifi(一)λi)其中yi=yj。在这变换中,新属性由参数λi确定,该参数从Beta分布中采样[44]。在生成新属性之后,我们设计损失来扩大叶类之间的特征距离:属性A和属性B之间的双曲线相似性可以定义为Lgen= −ˆfΣ日志ec·ρ(i,j)ecρ(f;i,j)(6)i,j∈YlP(a,b)=max,P(f(A),f(B))|i∈N(A,a),j∈N(B,b),式中,λ定义了λ到at的总距离(四)类i和j中的三个特征f(i)和f(j),即,ρ(f(i))+其中,样本索引集合k(A,a)={k|Xa a∈A,a ∈KAttr(xk)和类似的定义,对于B,b。这表明属性相似性被定义为包含相同属性a(或b)的类A(或B)中的样本子集内的样本之间的为了确定哪两个特征被选择用于生成未知样本,我们定义了一个阈值,该阈值限制来自两个不同叶类的特征之间的相似性。 G i ven两个不同的类yi和yj,其中yi=yj,并且y包含关于iv el y的属性a和b。在具有属性注释的数据集中,如果P(a,b)> th,则可以使用以下变换在双曲空间中生成新的属性特征:f=αif(yi)<$$>αj<$E.f(yj)(5)ρ(f,f(j ))。这里,距离测度ρ(,)被定义为欧几里得空间中的欧几里得距离c是温度超参数。是一组新颖的属性特征。生成的目标是最大化从生成的属性到原始属性的距离。双曲边信息学习的损失h如下所示,Lh=Lhp+Lgen + crLrelabel,(7)其中c r表示重标记损失的权重超参数。3.2. 祖先搜索在3.1节中,双曲网络H()只能实现开集识别的目标,而不能确定类别分类中未知样本因此,我们提出了用祖先搜索算法来训练网络N(·)其中yiyj,αi和αj表示归一化的confi。对未知样本进行分类叶类yi和yj 的dence 分 数,尊重iv el y。注:和分别是M obius加法和M obius标量乘法[17]在这个转换中,我们从边信息添加置信度得分,以协助新的属性特征生成。新属性应该接近具有较高置信度分数的属性 图2(d)部分显示了莫比乌斯加法的可视化。祖先搜索算法可以分为两个部分。第一部分是利用生成的n-超属性特征选择分类T_i。 Ti被定义为一个包含所有可能的非叶节点的分类。第二部分是祖先节点的移除过程。该过程递归地从Ti中取出节点作为Bref的标签,以训练对看不见的样本进行分类的深度神经网络。∈T4008\NN\J{|···我我我我--1p我1Q算法1训练祖先搜索算法要求:已知类的分类法Tk;双曲分类器Hk;生成的非属性集I;地面真值集yi。1:对于每一个i∈I做经济T i为新的特征T i提供潜在的新的类别y i。 设a表示n个超类,nLCA表示类A和n个超类i的最远共同祖先. T a代表分类学缺陷。例如,在图4中,a是祖先节点dog。然后,我们训练一个深度神经网络,2:找到初始预测祖先节点argmaxH(fi).3:从T k中选择分类T i。n=网络预测小说类。为了确保预测的小说类接近地面真实,该神经网络的输出yi=N(H(x))应该接近4:找到LCA节点n LCA并将所有祖先节点从Ti放置到yi。5:令起始节点a=yi(a)6:设list是{a→nLCA}的链表7:whilea∈Listanda∈ =nLCAanda∈ =nido潜在的新类别yi(图4)。设a=y i(a),其中yi(a)表示BMF的基础真值节点。列表定义为{a→nLCA}的链表。祖先搜索算法L的损失如下所示,Σ8:删除a并更新T\a,列表\a9:计算损失L,如在T \ a下的情况。L=a∈List(N(H10:移动到一个其中y(a)是T\a情况下的地面真值,并且11:end while结束12:结束分类选择。分类法选择的目标是找到输入属性特征的分类法Ti。由于Bclaf是由来自两个叶类A和B的两个属性特征生成的,因此应该考虑具有到叶类A和B的链接的所有非叶类。在这里,我们将nA和nB定义为非叶类的节点,(H(f))表示新属性i的预测。祖先搜索损失加上所有节点a在T a情况下的交叉熵损失。具体的祖先搜索算法可以在算法1中找到。4. 实验4.1. 数据集在GOSR实验中, 我们使用属性图像p q有分别指向叶子类A和B的链接路径数据集Caltech-UCSD鸟类数据集(CUB-200)[38]和T A={n A,· · ·,n A}和T B={n B,· · ·,n B}是两个潜在的分类。 我们将Ti定义为潜在的地面实况分类法。n Aj= 1,,p是叶类A的祖先节点。 然而,在Mobius变换过程中,属性生成过程中的置信度α i和α j对最终生成结果有很大影响.设α i和α j分别为叶类A和B的属性特征的置信度得分。如果αi>αj,T_i=T_ A。否则,Ti=T B。之后我们动物属性2数据集(AWA2)[23]。Cub-200[38]由11,788张图像组成,其中包含200种鸟类的精确量化的贡献注释。AWA2 [23]包含50种动物的85个属性。我们使用在以前的分层类检测工作中报告的类分类法[25]。对于基本的开集识别,我们还报告了一些广泛使用的数据集的结果,这些数据集没有使用[7]中相同的开集识别设置,包括MNIST[24],CIFAR-10[22],CIFAR-100我我需要初始预测节点来完成分类Ti。初始预测的节点ni=argmaxH(f)。Ti的定义如下所示T=.Ti−{ni,···,nroot}ni∈Ti.(八)[22],SVHN [29],Tiny Imagenet [33]。有关数据集的详细信息见附录。4.2. 评价接收机操作天线下的面积为-Tˆini∈/Ti选择tic(AUROC)曲线[28]和开放集分类率(OSCR)[10]作为开放集的评估指标其中nroot是Ti的根节点。图4示出了分类法选择过程中,CNOSF的初始祖先标签是ni=猫,Ti=T狗,其中do g分类法T犬=胎盘动物、食肉动物、犬科动物、犬。由于feline不在Ti中,所以所选择的分类Ti=Ti=Tdo g,这意味着所有四个节点都可以是非对象特征的真实值标签。祖先节点删除过程。这个过程会反复从tax的底部移除祖先节点,识别.广义开集识别的综合评价由平均层次距离[3](AHD)和层次相似性指数组成。AHD是分层识别任务的原始评价指标。层次相似性指数。由于AUROC和OSCR不能描述层次结构中的距离,开集识别中的评价指标不适合测量非叶类的差异我4009蓝鲸大猩狼Σ1Mgt1GT2M我们发现,HSI-b1往往提供了一个更好的分数,表1.CUB-200和AWA数据集上的广义开集识别结果(%)最佳结果以粗体显示方法[第38话][23]第二十三话[23]第二十三话AHD(↓)HSI-b1(↑)HSI-b2(↑)AHD(↓)HSI-b1(↑)HSI-b2(↑)AHD(↓)HSI-b1(↑)HSI-b2(↑)随机猜测1.9826.7342.143.0820.8624.963.0620.9825.15聚类1.8233.5654.282.8145.5850.292.7845.7750.96TD-LOO [25]1.7336.4860.912.6763.2362.492.6464.0563.11我们1.7138.6562.472.4865.0566.912.4765.4367.02本文提出了一种评价广义开集识别的层次相似性指数(HSI)。层次相似性指数由最低共同相似性(LCA)距离定义. LCA意味着地面实况和预测类的直接实例之间的最低共同祖先。在我们的实验中,我们报告了两个层次相似性指数(底部-1和底部-2),并将结果与平均层次距离进行比较。两个相似性指数都使用LCA的倒数GT:小说鲸鱼随机猜测:新型胎盘TD+LOO:新的水生动物Ours:小说鲸胎盘随机水生动物GT:小说类人猿随机猜测:新型食肉动物TD+LOO:新灵长类我们的:小说类人猿GT:新型犬随机猜测:新熊TD+LOO:小说狗我们的:新型犬科动物距离作为层次相似性指数。层次相似性指数越高,搜索性能越好. Bottom-1和Bottom-2两个字母-定义了特征相似性度量(HSI-b1和HSI-b2TD+LOO鲸鱼我们随机TD+LOO大猿我们随机我们狗TD+LOO作为HSI-b1HSI-bM= Mdl=1=1Σl=1lgt1.1LLCA11Σ(十)图5. AWA 2数据集上的结果可视化[23]。黄色框表示广义开集识别的地面真值分类树图显示了地面实况节点与随机猜测(蓝色),TD+LOO [25](橙色)和我们提出的方法(绿色)的结果之间的关系。这里,m是测试数据的总数。在恒生指数─完全正确的样本,这是更敏感时,b1,d.ylLLCA1距离表示直接LCA靠近叶节点。图5显示了一些通用的开集识别结果。图像下的文本地面真值祖先和最低共同祖先。在HSI-b2、d.ylLLCA2距离是地面说明了地面真值标签和比较方法的结果分类法说明了真值类和最低共同祖先。 以来层次距离的含义是从地面真值节点到LCA节点的距离,较低的层次距离表示较好的识别结果。HSI-b1和HSI-b2与AHD不同索引越大,识别未知类的性能越好。4.3. 广义开集识别我们首先比较基线方法,分层新颖性检测方法(TD+LOO)[25],以及我们在广义开集识别任务中对CUB-200和AWA 12数据集提出的方法,如表1所示。在这里,随机猜测基线是基于已知类的分类来猜测最近的一个节点聚类基线计算样本特征与所有祖先节点的特征之间的余弦相似度,并输出最相似的节点。根据表1的结果,我们的方法优于三种评价方法下的所有比较方法。与TD-LOO [25]相比,新的属性特征增强了祖先搜索算法的性能。是-祖先节点从可视化的角度来看,我们的方法的祖先节点结果更接近地面真值节点。例如,我们的方法将大猩猩识别为新的类人猿,而TD+LOO[25]的结果是新的灵长类动物。这是因为来自双曲边信息学习过程的新属性特征更好地捕获了非叶类的样本可变性。消融研究。 消融研究结果见表3。在第3.1节中,我们使用莫比乌斯变换生成不可见属性特征,并使用双曲相似度控制生成本文设计了一个关于莫比乌斯变换和双曲相似性约束的消融研究,评价方法与一般化开集识别任务相同。在我们的方法(案例4)中,两个选定的属性特征确定的超曲线相似性,和新的属性产生的莫比乌斯变换的置信度。在表3中,灵长胎盘食肉动物犬食肉动物胎盘熊y,yy,y,y,y2ln(dl>2LLCA2 +1)e.Σ4010表2.开集识别得到五个数据集,'-'表示原始论文中未报道的结果。粗体数字代表最佳性能。Tiny IN代表Tiny ImageNet数据集。AUC表示AUROC结果方法MNIST[24]SVHN[29][22]第二十二话[22]第二十二届会议[33]第三十三话AUC OSCRAUC OSCRAUC OSCRAUC OSCRAUC OSCRSoftmax97.83 99.2688.62 92.8467.76 88.9484.32 81.9357.71 59.93Openmax [2]98.13-89.41-69.51-79.63-57.64-胶囊[18]九十九点二二-94.60-83.53-88.98-71.51-GCPL [39]99.21 99.1194.3092.8584.69 82.4285.45 88.3069.43 49.47RPL [8]98.91 99.2393.41 92.4682.72 85.2683.29 89.6368.87 53.21ARPL [7]九十九点三七91.7885.98 81.4790.32 90.2774.40 58.42ARPL+cs [7]九十九点五一九十九点四七94.61 91.8586.17 81.3090.6586.8078.07 65.58我们99.43 99.4094.7892.7189.52 86.4190.4589.7678.19 65.74表3. CUB-200数据集上的消融研究。 相似度de-80注意到双曲相似性约束,而莫比乌斯表示莫比乌斯变换757065第一种情况是从两个不同的已知类中随机选择属性特征,而不使用Mobius分类。 例2只使用了莫比乌斯变换。案例3仅使用双曲相似性约束。实验结果表明,Mobius变换和双曲相似性约束都此外,我们在附录中提供了双曲特征映射的分析。4.4. 开放集识别与最新技术水平的比较。我们应用AU-ROC和OSCR度量来评估基本开集识别的性能由于在开集识别中没有可用的边信息,所以重新标记r的部分被设置为零。双曲线占位符的数量等于非叶类的数量。表2中报告了AUROC和OSCR的结果,其中数字是来自五个随机试验的平均分数。在CIFAR+50实验中,从CIFAR-100中随机抽取50个不重叠的类作为未知类。从表2中可以看出,我们的方法在CIFAR10[22]和Tiny ImageNet[33]数据集中具有更好的识别由于比较方法的开集设置是不相同的,我们报告的AUROC和OSCR性能的基础上,我们自己的开集设置。某些结果可能与原文献不同。有关实验设置的详细信息,请参见附录。讨论表2中的结果是五个独立实验的平均值。我们提出的方法在更复杂的数据集上显示出更好的识别能力相比60550.0 0.2 0.4 0.6 0.8 1.0双曲线相似性图6.从随机属性生成到选择属性生成,AUROC的阈值不同使用最先进的方法ARPL+cs [7],我们不生成混淆样本,以确保通用开集识别的性能为了证明双曲边信息学习提高了识别能力,我们比较了不同实验设置下的AUROC结果在图6中,我们使用不同的双曲线相似性阈值报告了Tiny ImageNet数据集中的AUROC性能。当阈值t等于0.6时,我们的方法实现了最佳AUROC更多的结果可以在附录中找到。5. 结论本文提出了一种双曲边信息学习框架和一种祖先搜索算法来捕获未知样本的变异性并解决GOSR问题。在我们的框架中,生成的属性特征更好地捕捉未知样本的可变性。此外,我们提出了层次相似性指标来衡量GOSR的性能。从实验结果来看,我们的框架在GOSR问题和开集识别方面优于现有的方法。Softmax我们AUROC评分方法相似性莫比乌斯AHD(↓)HSI-b1(↑)HSI-b2(↑)Case1✓✓✓✓1.7535.2359.83Case21.7336.2561.22Case31.7336.7860.54案例41.7138.6562.474011引用[1] 包文涛、齐钰、俞空。用于开集动作识别的证据深度2021年国际计算机视觉会议[2] Abhijit Bendale和Terrance E Boult。开放深度网络。在计算机视觉和模式识别会议上,第1563-1572页[3] LucaBertinetto 、 RomainMueller 、 KonstantinosTertikas、Sina Samangooei和Nicholas A Lord。更好地理解错误:利用深层网络的类层次结构.在计算机视觉和模式识别会议上,第12506-12515页[4] 西尔弗·波纳贝尔黎曼流形上的随机梯度下降。IEEE自动控制学报,58(9):2217[5] Ines Chami , Adva Wolf , Da-Cheng Juan , FredericSala,SujithR a vi和ChristopherRe'。低维h-perbolic知识图嵌入。arXiv预印本arXiv:2005.00545,2020。[6] InesChami,ZhitaoYing,ChristopherRe´,andJureLeskovec.双曲线图卷积神经网络。神经信息处理系统的进展,32:4868[7] Guangyao Chen , Peixi Peng , Xiangqian Wang , andYonghong Tian. 开 集识 别 的对 抗 互反 点 学习 。 IEEETransactionsonPatternAnalysisandMachineIntelligence,2021。[8] Guangyao Chen , Limeng Qiao , Yemin Shi , PeixiPeng , Jia Li , Tiejun Huang , Shiliang Pu , andYonghong Tian.具有可判别倒易点的开集网络学习。欧洲计算机视觉会议,2020年8月。[9] 崔亚文,余梓潼,彭伟,刘丽。 用双曲几何中的开集假设重新思考少次类增量学习。arXiv预印本arXiv:2207.09963,2022。[10] AkshayRajDhamija,ManuelGunther,andTerranceEBoult.减少网络不可知恐惧症。arXiv预印本arXiv:1811.04110,2018。[11] Bhuwan Dhingra , Christopher J Shallue , MohammadNorouzi,Andrew M Dai,and George E Dahl.在双曲空间 中 嵌 入 文 本 。 arXiv 预 印 本 arXiv : 1806.04313 ,2018。[12] 汤姆·迪特和奥卢瓦塞伊·费伊塞坦。在分析文本数据时保护隐私在PrivateNLP@ WSDM,2020。[13] 欧根·加内亚、加里·贝西纽和托马斯·霍夫曼。双曲神经网络神经信息处理系统的进展,31,2018。[14] ZongYuan Ge , Sergey Demyanov , Zetao Chen , andRahil Garnavi.多类开集分类的生成openmax。arXiv预印本arXiv:1707.07418,2017。[15] 耿传兴和陈松灿开集识别的集体决策IEEE Transactionson Knowledge and Data Engineering,2020。[16] Chuanxing Geng,Sheng-jun Huang,and Songcan Chen.开集识别的最新进展:一个调查。IEEE transactions onpattern analysis and machine intelligence,43(10):3614[17] 米哈伊尔·格罗莫夫双曲群在群论论文,第75-263页。Springer,1987年。[18] 郭云瑞,古列尔莫·坎波雷塞,杨文靖,阿莱桑-德罗·斯佩杜蒂,兰贝托·巴兰。用于开集识别的条件变分胶囊网络,2021年。[19] Mehadi Hassen和Philip K Chan.学习基于神经网络的开集识 别表示 。国际 数据挖 掘会议 ,第 154-162页。SIAM,2020年。[20] Valentin Khrulkov,Leyla Mirvakhabova,Evgeniya Usti-nova,Ivan Oseledets,and Victor Lempitsky.双曲线图像嵌入。在计算机视觉和模式识别会议上,第6418-6428页[21] 舒空和德瓦·拉曼南。Opengan:通过开放数据生成的开放集识别。ICCV,2021。[22] Alex Krizhevsky,Geoffrey Hinton,等.从微小的图像中学习多层特征。2009年[23] Christoph H Lampert , Hannes Nickisch , and StefanHarmeling. 基于属性的零镜头 视觉对象分类。IEEETransactionsonPatternAnalysisandMachineIntelligence,36(3):453[24] 杨乐存。mnist手写数字数据库。http://yann. 乐村1998年。[25] Kibok Lee , Kimin Lee , Kyle Min , Yuting Zhang ,Jinwoo Shin,and Honglak Lee.用于视觉对象识别的分层新颖性检测。在IEEE计算机视觉和模式识别会议论文集,第1034-1042页[26] Shaoteng Liu,Jingjing Chen,Liangming Pan,Chong-Wah Ngo,Tat-Seng Chua,and Yu-Gang Jiang.用于零拍识别的双曲在IEEE/CVF计算机视觉和模式识别会议(CVPR)上,2020年6月。[27] Massimiliano Mancini , Muhammad Ferjad Naeem ,Yongqin Xian,and Zeynep Akata.开放世界的零距离合成学习。在IEEE/CVF计算机视觉和模式识别会议论文集,第5222- 5230页[28] Lawrence Neal , Matthew Olson , Xiaoli Fern , Weng-Keen Wong,and Fuxin Li.用反事实图像进行开放式学习。欧洲计算机视觉会议,第613-628页[29] Yuval Netzer , Tao Wang , Adam Coates , AlessandroBis-sacco,Bo Wu,and Andrew Y Ng.使用无监督特征学习读取自然图像中的数字。2011年。[30] 马克西米利安·尼克尔和杜韦·基拉。庞加莱嵌入学习分层表示。神经信息处理系统的进展,30:6338[31] Wei Peng , Tuomas Varanka , Abdelrahman Mostafa ,Henglin Shi,and Guoying Zhao.双曲深度神经网络:一个调查。ArXiv,abs/2101.04562,2021。[3
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功