p(y ′)|fi):不同领域的数据集。元数据集的跨域属性为了严格验证不同领域下的特征适应能力,我们使用ImageNet专用训练集对特征提取器进行预训练。实现细节骨干的预培训:网络和培训环境的选择。ILSVRC-2012(Russakovsky et al. 2015)在Meta中-数据集分为712个训练类,158个验证类和130个测试类。我们使用712个类的训练集来训练两个具有主干的特征提取器:ResNet18和ResNet34。对于ResNet 18,我 们 遵 循 Meta-Baseline 中 相 同 的 协 议 ( Chen etal.2020),即:图像随机调整大小,裁剪为128 x128,水 平 翻 转 和 归 一 化 。 对 于 ResNet34 , 我 们 遵 循(Doersch,Gupta和Zisserman2020)中相同的结构修改,其对最后一个残差块使用步幅1和扩张卷积,初始学习率被设置为0.1,权重衰减为0.0001,并且每30个epoch减少0.1倍,总共90个epoch。这两个模型都是使用批大小为256的SGD优化器训练的。expwk,f'经验值k,fi(十一)评估和微调的设置。 总Cj=1 expwj,f'Cj=1 expwj,fi对元数据集的评估利用了灵活的事件采样(Triantafillouet al. 2019年,它允许最大-分子expwk,f'代表距离是-补间要素及其类原型和分母妈妈的500个图像在支持集在一集。在微调阶段,尺度向量s被初始化为值. 数据论证工作作为补充和中心裁剪Cexp一个包含所有类原型的特性。该准则表明,在高维特征空间中,采样点在更接近其类原型或远离其他类的情况下无论哪种方式,确保接受点提供有用的信息,避免随机游走采样的缺点。在特征空间上的这种选择的采样允许探索未知特征空间,同时仍然控制采样的质量以优化。如图2b,通过用选定的样本扩大支持集选择采样是每个迭代的持续过程,有助于增强特征分布聚类。实验验证在本节中,我们首先进行全面的烧蚀实验,以验证DCM和SS的有效性,并分析我们的方法如何在镜头分析下提高性能然后我们将我们的结果与其他最新降低标准化。我们遵循《古兰经》的教导。2019年),学习率为0.00005,Adam优化器和总共25个时期。用于采样的建议分布中的σ被设置为0。1.一、采用整批更新进行了微调实验。消融研究我们首先研究了在使用典型类原型(支持集的平均特征)进行微调时应用DCM的重要性,然后在应用DCM时,我们添加SS来重新定义类原型。所有消融结果见表。1.一、DCM支持竞争领域无关的快速功能调整,以进行微调。DCM有两个功能:特征归一化和尺度向量乘法.我们首先独立地评估特征归一化(FN)带来的仅仅微调骨干并不能保证+v:mala2255获取更多论文ILSVRCOmniglot飞机CU_鸟类DTDQuickdraw真菌Vgg_flower交通标志MSCOCO一点两点1.750.951.500.901.250.851.000.750.800.500.750.250.000 5 10 15 2025时代0 5 10 15 20 25时代(a) (b)损失图4:元数据集标准基准的收敛曲线对于每个数据集,我们绘制了微调期间每个时期600集的平均准确度和损失虚线表示微调骨架,实线表示用DCM微调骨架。对于所有10个数据集,使用DCM微调主干显示出更快的速度,以达到良好的训练精度和更低的损失值。BSFNSSILSVRCOmni阿克拉夫特鸟类DTDQDraw真菌花签署CocoC58.4758.6169.8077.1154.3569.8776.5175.2075.4776.8277.6885.8644.4744.3189.1091.3448.1870.5656.9356.96CC59.1077.6971.8478.8076.4886.0047.2892.3074.4357.94CCC59.9678.7072.3278.3076.9686.0447.5191.9576.3957.32CCCC60.9480.4572.9379.8577.7886.747.8592.4677.88五十八点八五表1:使用ResNet18对DCM和SS进行消融研究使用平均600次发作报告结果分别或组合使用骨干(B)、尺度向量(S)、特征归一化(FN)和选择采样(SS)的微调被验证。由于不同的域间隙,所有数据集的性能提高,特别是对于CU-鸟类和真菌,如表所示。1. 在这些数据集中,微调主干实际上并不起作用,提高3。10%的CU-鸟类和3。39%的真菌通过简单地添加特征归一化。通过添加尺度向量,10个数据集中有7个数据集的性能得到了进一步提高。这些结果表明DCM改善了对来自不同领域的数据集进行微调的一般化我们进一步绘制了图中微调迭代过程中的训练损失和准确性。4.曲线图显示,DCM微调拥有最高的收敛速度相比,直接微调。在收敛速度上的优势体现了DCM的快速特征自适应特性。选定采样可以持续提高所有数据集的性能。通过添加选定的采样,所有数据集的性能都从0. 34%对1。百分之七十五对于10个数据集中的6个,性能提高了大约1%。特别是对于ILSVRC、Birds和MSCOCO,与微调主干或在主干上添加DCM相比,SS带来的性能提升最为显著。这些数据集在以下方面各不相同对象,并涵盖一个类内的重大变化例如,CU-Birds对细粒度分类有很高的要求。性能增益强烈表明,使用选择的采样来纠正类原型,以及在不同的领域功能。DCM与SS在极少数情况下起着至关重要的作用。同时,我们进一步评估DCM+SS如何进行微调,特别是在极少数镜头下。如图所示。5,通过固定一集中的镜头数量,我们为每个数据集运行600集微调主干会导致性能下降,每个类只有一个或两个镜头,而DCM+SS可以大大弥补性能损失。同时,仅通过增加发射次数(比较FT-B在2次发射和3次发射上的性能),微调可以在相对较小的范围内得到改善。添加DCM+SS可以在2次拍摄情况下获得更多的性能增益。DCM+SS基本上提高了几个镜头的性能。总之,DCM+SS在极少数拍摄情况下显示出持续的显著性能提高。DCM与SS功率微调。从桌子。1、微调提高了7. 31%至ILSVRCOmniglot飞机CU_鸟类DTDQuickdraw真菌Vgg_flower交通标志MSCOCO精度损失+v:mala2255获取更多论文方法骨干ILSVRCOmni阿克拉夫特鸟类DTDQDraw真菌花签署Cocofo-Proto-MAML(Triantafillou et al. 2019年度)-49.5359.9853.1068.7966.5648.9639.7185.2747.1241.00CNAPS(Requeima et al. 2 0 1 9 年度)-50.6045.2036.0060.767.542.330.170.753.345.2BOHB-Englance(Saikia,Brox和Schmid2020)-55.3977.4560.8573.5672.8661.1644.5490.6257.5351.86LR(Tian et al. 2020年)ResNet1860.1464.9263.1277.6978.5962.4847.1291.6077.5157.00元基线(Chen et al. 2020 年)ResNet1859.2069.1054.1077.3076.0057.3045.4089.6066.2055.70换能器微调(Dhillon et al. 20 1 9 年度)WRN-28-1060.5382.0772.4082.0580.4757.3647.7292.0164.3742.86CTX最佳(Doersch,Gupta和Zisserman,2020)ResNet3462.7682.2179.4980.6375.5772.6851.5895.3482.6559.90分类器-基线ResNet1858.4769.8054.3576.5175.4777.6844.4789.1048.1856.93DCM+SSResNet1860.9480.4572.9379.8577.7886.747.8592.4677.8858.85分类器-基线ResNet3460.3772.3861.1977.9375.9179.7642.7789.8048.5651.79DCM+SSResNet3464.5881.7779.6784.9477.8987.1449.3493.2488.6557.69表2:元数据集标准基准的结果。我们提供了600多个事件的统计结果。如上所示,与最近的工作相比,我们的方法在所有十个数据集上带来了一致的性能改进这表明我们提出的偏差减少方法可以有效地适用于不同的数据域。元数据集上的镜头分析12108642021发2发3发5发10发支持集。比较ResNet18和ResNet34的性能,我们首先观察到,具有较大输入图像大小的较大主干提供了更好的特征提取器质量。此外,我们的方法表明,当特征提取器本身更强大时,预训练的特征提取器对新数据域的适应能力甚至可以得到提高。通过一个简单的测试时微调,我们在几个数据集上实现了最先进的性能,并在ResNet18和ResNet34的所有数据集上获得了具有竞争力的结果。(Tian et al.2020)仅对测试集上的分类器进行微调,并且使用相同的主干ResNet18,我们的方法在大多数数据集上都以较大的幅度超过了其结果这解决了细化新类特征以更好地泛化的重要性对于(Doer-sch,Gupta和Zisserman2020),它超越了我们在四个数据集上的结果,除了预训练的特征提取器之外,还使用了七天的综合元训练过程图5:在不同拍摄次数下使用Finetuning w/o DCM+SS获得的性能增益性能平均超过600集,报告的性能增益平均超过元数据集中的不同数据集。15个。在几个数据集上为52%,但在鸟类和真菌上性能下降。DCM+SS与微调骨干显示一致的性能提升所有数据集从1。92%(mscoco)至29。7%(交通标志)。我们希望这一结果鼓励进一步探索减少偏见的特征分布。与最先进的性能进行比较我们报告我们的结果在不同的骨干模型,并提供了一个比较表中的其他流行的方法。2. 与直接使用预训练的特征提取器进行评估相比,使用DCM+SS对主干进行微调可以两种主链的结果一致。这证明了直接使用在他们的工作中报告的收敛也被利用。我们使用的ResNet34特征提取器仅通过使用训练集的监督分类损失进行训练。同时,我们的方法在计算上是高效的,因为我们几乎不涉及任何网络结构的变化(只有一个带有尺度向量的DCM层)。抽样以高效的整批方式进行。(Dhillon et al. 2019)在转换微调期间包含额外的查询集,这会在DTD上产生更好的而我们的微调只使用支持集。我们超越了其他九个数据集的结果,并在DTD上获得了一致的性能增益。结论我们在实验中表明,在没有任何元训练过程的情况下,快速特征自适应也可以通过更好地理解特征分布中的偏差来实现。我们希望我们的工作可以提供洞察的重要性,减少偏差的分布时,处理来自不同领域的数据集的少镜头学习。FT-BFT-B+DCM+SS业绩增长(%)+v:mala2255获取更多论文引用Bertinetto,L.;Henriques,J.F.地; Torr,P.H.的; 和维达尔迪,A. 2018.使用可微封闭形式求解器的元学习。arXiv预印本arXiv:1805.08136。陈文Y的;刘玉- C.的; Kira,Z.;王玉- C. F.地;和Huang,J.- B. 2019. 近 距 离 观 察 少 数 镜 头 分 类 。 arXiv :1904.04232。陈玉;王,X.;刘志;徐,H.; Darrell,T. 2020.一个新的元基线用于少量学习。arXiv预印本arXiv:2003.04390。Dhillon,G.S.的; Chaudhari,P.;Ravichandran,A.;而索阿托,S. 2019.一种用于少数镜头图像分类的基线。arXiv预印本arXiv:1909.02729。Doersch , C.; 古 普 塔 , A.; 和 Zisserman , A. 2020.CrossTransformers:空间感知的少数镜头转移。arXiv预印本arXiv:2007.11498。Finn,C.; Abbeel,P.;和Levine,S. 2017.模型不可知元学习用于深度网络的快速适应。在第34届机器学习国际会议上,第70卷,1126-1135。JMLR。org.Garcia,V.;和Bruna,J.2017年。图神经网络的少样本学习arXiv预印本arXiv:1711.04043。Gidaris,S.;Burnard,A.;Komodakis,N.;Pe'rez,P.;和科德,M. 2019.用自我监督促进少数视觉学习。CoRR,绝对值/1906.05186。Gidaris,S.;和Komodakis,N.2018年动态少数镜头视觉学习而不会忘记。IEEE计算机视觉与模式识别会议论文集,4367Gidaris,S.;和Komodakis,N. 2019.用GNN去噪自编码器生成分类权值用于少拍学习.arXiv预印本arXiv:1905.01102。Guo,Y.;和Cheung,N.-M. 2020年。通过信息最大化进行少量学习的注意权重IEEE/CVF计算机视觉和模式识别会议论文集,13499Hariharan,B.;和Girshick,R. 2017.通过缩小和幻觉特征进行低镜头视觉识别。在IEEE计算机视觉国际会议上,3018Hou , R.; Chang , H.; Bingpeng , M.; Shan , S.; 和Chen,X. 2019.交叉注意力网络在少镜头分类中的应用神经信息处理系统的进展,4005Kim,J.; Kim,T.; Kim,S.;和Yoo,C. D. 2019.用于少样本学习的边缘标记图神经网络。IEEE计算机视觉与模式识别会议论文集,11Krizhevsky,A.; Sutskever,I.;和Hinton,G. E. 2012.使用深度卷积神经网络的Im-agenet分类。神经信息处理系统的进展,25:1097李,K.; Maji,S.; Ravichandran,A.;和Soatto,S. 2019.可微凸优化的元学习。IEEE计算机视觉与模式识别会议论文集,10657Li,A.;黄,W.;兰,X.;冯,J.; Li,Z.;和Wang,L. 2020.用自适应裕量损失增强少样本学习。IEEE/CVF计算机视觉和模式识别会议论文集,12576李,H.; Eigen,D.; Dodge,S.; Zeiler,M.;和Wang,X.2019年a。寻找任务相关的功能,为少数拍摄学习-ing类别训练。在IEEE计算机视觉和模式识别会议论文集,1李,X.;孙,Q.;刘玉;周,Q.; Zheng,S.; Chua,T.-S.的; Schiele,B. 2019年b.学习自我训练半监督少镜头分类。神经信息处理系统的进展,10276刘,C.; Xu,C.;王玉;张,L.; Fu,Y. 2020.这是一次性学习的一个非常简单的基线在IEEE/CVF计算机视觉和模式识别研讨会上,922Qi,H.;布朗,M.;和Lowe,D. G. 2018.低杆学习- ING与印记的重量。IEEE计算机视觉与模式识别会议论文集,5822-5830。Ren , M.; Triantafillou , E.; Ravi , S.; Snell , J.;Swersky , K.; Tenenbaum , J. B.; Larochelle , H.; 和Zemel,R. S. 2018.半监督少镜头分类的元学习。arXiv预印本arXiv:1803.00676。Requeima,J.; Gordon,J.; Bronskill,J.; Nowozin,S.;和Turner,R.E. 2019年。使用条件神经自适应过程的快速灵活的多任务arXiv预印本arXiv:1906.07697。Russakovsky,O.;邓,J.;苏,H.; Krause,J.; Satheesh,S.;马,S.;黄志;Karpathy ,A.;Khosla,A.;Bernstein ,M.;Berg,A.C.的; 和Fei-Fei,L.2015年。ImageNet大规模 视 觉 识 别 挑 战 。 International Journal of ComputerVision(IJCV),115(3):211Rusu,A.一、饶,D。; Sygnowski,J.; Vinyals,O.;Pas- canu,R.;奥辛德罗,S.;和Hadsell,R. 2018.具有潜在 嵌 入 优 化 的 Meta 学 习 arXiv 预 印 本 arXiv :1807.05960。Saikia,T.; Brox,T.;和Schmid,C. 2020.优化的通用特征学习,用于跨领域的少量分类。arXiv预印本arXiv:2001.07926。Simon,C.; Koniusz,P.; Nock,R.;和Harandi,M. 2020.自适应子空间的少镜头学习。IEEE/CVF计算机视觉和模式识别会议论文集,4136Snell,J.; Swersky,K.;和Zemel,R. 2017.用于少量学习的原型网络。神经信息处理系统进展,4077Sung , F.; 杨 ; 张 , L.; Xiang , T.; 托 , P.H.; 和Hospedales,T.M. 2018年学习比较:关系网络的少数镜头学习。IEEE计算机视觉与模式识别会议论文集,1199田,Y.;王玉; Krishnan,D.; Tenenbaum,J. B.; Isola,P.2020.重新思考少拍图像分类:一个好的嵌入是你所需要的一切?arXiv预印本arXiv:2003.11539。+v:mala2255获取更多论文Triantafillou,E.; Zhu,T.; Dumoulin,V.; Lamblin,P.;Evci , U.; Xu , K.; Goroshin , R.; Gelada , C.;Swersky,K.;曼-扎戈尔,P. -一、等,2019年。元数据集:一个数据集的数据集,用于学习从几个例子中学习。arXiv预印本arXiv:1903.03096。Vinyals,O.; Blundell,C.
下载后可阅读完整内容,剩余1页未读,立即下载
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![-](https://csdnimg.cn/download_wenku/file_type_lunwen.png)
![-](https://csdnimg.cn/download_wenku/file_type_lunwen.png)
![-](https://csdnimg.cn/download_wenku/file_type_lunwen.png)
![-](https://csdnimg.cn/download_wenku/file_type_lunwen.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
- 粉丝: 4
- 资源: 2万+
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- VMP技术解析:Handle块优化与壳模板初始化
- C++ Primer 第四版更新:现代编程风格与标准库
- 计算机系统基础实验:缓冲区溢出攻击(Lab3)
- 中国结算网上业务平台:证券登记操作详解与常见问题
- FPGA驱动的五子棋博弈系统:加速与创新娱乐体验
- 多旋翼飞行器定点位置控制器设计实验
- 基于流量预测与潮汐效应的动态载频优化策略
- SQL练习:查询分析与高级操作
- 海底数据中心散热优化:从MATLAB到动态模拟
- 移动应用作业:MyDiaryBook - Google Material Design 日记APP
- Linux提权技术详解:从内核漏洞到Sudo配置错误
- 93分钟快速入门 LaTeX:从入门到实践
- 5G测试新挑战与罗德与施瓦茨解决方案
- EAS系统性能优化与故障诊断指南
- Java并发编程:JUC核心概念解析与应用
- 数据结构实验报告:基于不同存储结构的线性表和树实现
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)