主动学习方法中的不确定性和多样性相结合的最新进展和与任务无关的方法

86 浏览量更新于2023-10-16 收藏 18.65MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

7516751775180主动学习（AL）：传统的AL方法是迭代方案，它为一组信息丰富的数据样本获取标签（来自oracle或专家）。然后，新标记的样本被添加到现有标记数据的池中，并且模型再次在标记数据上进行训练。所提出的技术可以分为两类：1）基于不确定性的方法：在这种情况下，模型对特定样本的不确定性通过特定的准则（如熵[40]等）进行测量。2）多样性或覆盖性方法：这些方法侧重于选择一组多样性标记点，以改善模型的整体性能。在这种情况下，其中一种流行的方法是Core-Set[30]，它选择样本以最大化特征空间中的覆盖范围。然而，像BADGE[1]这样的最新方法结合了不确定性和多样性，实现了最先进的性能。还提出了一些与任务无关的主动学习方法[34,42]。0主动领域自适应：Rai等人[25]首次尝试了主动领域自适应，他们使用基于线性分类器的准则来选择用于情感分析的标记样本。Chattopadhyay等人[4]提出了一种通过解决单个凸优化问题来执行领域自适应和主动学习的方法。AADA（基于主动对抗领域自适应）[35]是一种基于分类器输出和DANN中使用的领域鉴别器的混合信息准则的方法。AADA中用于选择批次的准则是一个点估计，可能导致冗余的样本选择。我们引入了一种基于集合的信息准则来选择要标记的样本。CLUE[24]是一项最近的并发工作，它通过不确定性加权聚类来选择样本进行主动DA。03. 背景03.1. 定义和符号0定义：我们首先定义一个集合函数f(S)，其中输入是一个集合S。子模函数是一个集合函数f: 2Ω →R，其中2Ω是集合Ω的幂集，其中包含所有元素。子模函数的特点是递减收益，即将一个新元素添加到较小的集合中，必须产生比添加到较大集合中更大的f增加。这在数学上表述为对于每个S1，S2 � Ω，其中S1 � S2，对于Ω \S2中的每个x，以下属性成立：0f(S1 ∪ {x}) - f(S1) ≥ f(S2 ∪ {x}) - f(S2) (1)0这个属性被称为递减收益属性。使用的符号：在后续的章节中，我们使用hθ(x)0作为分类器的softmax输出，hθ(x)是fθ ◦gθ(x)的组合，其中gθ(x)是将输入映射到嵌入的函数，fθ进行最终分类。领域鉴别器是一个网络Dφ(gθ(x))，它将样本分类为源域和目标域，从而对齐领域。我们使用D来表示来自两个域的组合数据，并使用D s 和D t分别表示来自源域和目标域的标记数据。D u表示未标记的目标数据。在主动DA中，我们将预算B定义为从D u 中选择的目标样本数量，并在每个周期将其添加到Dt 中。主动领域自适应：在每个周期中，我们首先使用D s作为源和D u 作为目标进行DA。然后利用主动学习技术从Du 中选择B个最具信息量的样本，然后将其添加到D t中。这将在C个周期内执行。03.2. 集群假设0集群假设表明决策边界不应位于数据样本的高密度区域，这是我们方法的主要动机。为了强制执行集群假设，我们使用VADA[33]方法中的两个附加目标。第一个目标是在未标记的目标数据Du上最小化条件熵。这通过使用以下损失函数来实现：0L_c(θ;Du)=−Ex�Du[h_θ(x)Tlnh_θ(x)] (2)0上述目标确保了目标样本的聚类形成，因为它在目标数据上强制执行高置信度的分类。然而，由于神经网络的大容量，学习到的分类函数可能是局部非Lipschitz的，这可能导致输入的微小变化引起函数值的大变化。这导致了对条件熵损失L_c的不可靠估计。为了强制局部Lipschitz性，我们使用了第二个目标，这个目标最初是在虚拟对抗训练（VAT）[19]中提出的。它确保了包围样本的�范数球的平滑性。VAT目标如下所示：0L_v(θ;D)=Ex�D[max||r||≤�DKL(h_θ(x)||h_θ(x+r))] (3)04. 提出的方法0在主动领域自适应中，有两个不同的步骤，即样本选择（即采样）和领域自适应，我们在下面进行描述：04.1. 子模集合选择04.1.1 虚拟对抗配对（VAP）得分0在我们的模型架构中，我们只使用线性分类器和对领域不变特征f_θ(x)的softmax进行分类。由于线性特性，我们从中汲取灵感。7519L(θ; Ds, Dt, Du) = Ly(θ; Ds, Dt) +752004.1.4 结合三个得分函数0我们通过将增益定义为VAP(xi)、d(S,xi)和R(S,xi)的凸组合来定义集合函数f(S)。0f(S∪{xi})−f(S)=αVAP(xi0+ (1−α−β)R(S,xi) (9)0这里，0≤α，β，α+β≤1是控制不确定性、多样性和代表性项相对强度的超参数。我们在通过方程9将这三个分数归一化之前，先对它们进行归一化。引理1：由方程9定义的集合函数f(S)是子模函数。引理2：由方程9定义的集合函数f(S)是一个非递减的单调函数。我们在补充材料第2节中证明了上述引理。整体采样方法的概述见图3。04.1.5 子模优化0正如我们在前一节中所示，集合函数f(S)是子模函数，我们的目标是选择满足以下目标的集合S：0maxS:|S|=Bf(S) (10)0为了获取要选择的样本集合S，我们使用贪婪优化过程。我们从一个空集S开始，然后迭代地添加每个项目。对于在未标记集合中选择每个样本(xi)，我们计算每个样本f(S∪{xi})−f(S)的增益。具有最高增益的样本然后被添加到集合S中。上述迭代过程一直进行，直到我们用尽了标记预算B。贪婪算法的性能保证由以下结果给出：定理1：令S�是最大化方程10中目标的最优集合，则贪婪算法找到的解S具有以下保证（见Supp. Sec. 2）：0f(S)≥1−10e0f(S�) (11)0多样性组件的洞察：当α=0且β=1时，优化算法退化为基于多样性的核心集合（K-CenterGreedy）采样的贪婪版本[31]。基于类似思想的多样性函数也已在不同应用中进行了探索[12,3]。更多细节请参见补充材料第3节。04.2. 虚拟对抗主动领域自适应0基于鉴别器对齐的无监督DA方法未能有效利用额外的标记数据。0存在于目标域中[29]。这就需要对现有方法进行修改，使其能够有效地利用额外的标记目标数据，并提高目标数据的泛化能力。在这项工作中，我们通过修改增强了VADA（虚拟对抗主动领域自适应），使其能够有效地使用标记的目标数据。我们在算法1中给出了选择样本进行标记（即Dt）的子集选择过程，并在图2中给出了示意图。为了将标记的特征（Ds∪Dt）与Du对齐，我们使用了领域对抗训练（DANN）损失函数，如下所示：Ly(θ;Ds,Dt)=E(x,y)�(Ds∪Dt)[yTlnh_θ(x)] (12)0L d ( θ ; D s , D t , D u ) = sup D φ E x �D s ∪D t [ln D φ( f θ ( x ))]0+ E x �D u [ln(1 − D φ ( f θ ( x )))](13)0由于我们的采样技术基于聚类假设，为了强制执行它，我们添加了在方程2中定义的条件熵损失。此外，为了通过虚拟对抗训练实现利普希茨连续性，我们使用在方程3中定义的损失。最终的损失函数如下所示：0λ d L d ( θ ; D s , D t , D u ) + λ s L v ( θ ; D s ∪D t ) + λ t ( L v ( θ ; D u ) + L c ( θ ; D u )) (14)0在我们的所有实验中，使用的λ值都是相同的，并在补充材料的第5节中提到。VADA和VAADA之间的差异：我们对VADA进行了以下重要更改，使VADA能够有效利用标记的目标数据的额外监督，并用于VAADA过程：1）所有层的高学习率：在VAADA中，我们对所有层使用相同的学习率。在众多的DA方法[29，18]中，为了获得最佳性能，使用较低的学习率来训练初始层。我们发现，尽管这种做法对于无监督DA有所帮助，但对于主动DA性能有所损害（在补充材料的第5节中通过实验证明）。2）使用梯度裁剪代替指数移动平均（EMA）：我们对所有网络权重使用梯度裁剪来稳定训练，而VADA使用EMA。我们发现，与VADA相比，裁剪使VAADA的训练更加稳定，并显著提高了性能。我们发现VAADA能够在不同的数据集上稳健地工作。在[29]中已经表明，VADA在用于目标标签也可用于训练的设置中无法获得性能提升。这也与我们的观察一致，即VAADA在主动DA场景中明显优于VADA（在补充材料的第5节中通过图10进行了演示，并进行了额外的分析）。75217522752375240参考文献0[1] Jordan T. Ash，Chicheng Zhang，AkshayKrishnamurthy，John Langford和Alekh Agarwal.通过多样性、不确定梯度下界进行深度批量主动学习.在学习表示国际会议上，2020年。3，6，70[2] A. Bhattacharyya. 两个多项式总体之间的差异度量.Sankhy¯a: The Indian Journal of Statistics(1933-1960)，7(4):401-406，1946年。40[3] Shayok Chakraborty，VineethBalasubramanian和Sethuraman Panchanathan.自适应批量模式主动学习.IEEE神经网络和学习系统交易，26(8):1747-1760，2014年。50[4] Rita Chattopadhyay，Wei Fan，IanDavidson，Sethuraman Panchanathan和Jieping Ye.联合迁移和批量模式主动学习.在机器学习国际会议上，页码253-261. PMLR，2013年。30[5] 陈明浩，赵帅，刘海峰，蔡登.用于领域自适应的对抗学习损失.在AAAI人工智能会议论文集中，卷34，页码3521-3528，2020年。10[6] 陈明浩，赵帅，刘海峰，蔡登.用于领域自适应的对抗学习损失.arXiv，abs/2001.01046，2020年。60[7] David Cohn，Les Atlas和Richard Ladner.通过主动学习改善泛化性能.机器学习，15(2):201-221，1994年。10[8] 邓志杰，罗宇岑，朱军.带有教师的聚类对齐用于无监督领域自适应.在计算机视觉国际会议的IEEE/CVF论文集中，页码9944-9953，2019年。20[9] Yaroslav Ganin和Victor Lempitsky.通过反向传播进行无监督领域自适应.在机器学习国际会议上，页码1180-1189. PMLR，2015年。1，20[10] H. Goluba和Henk A. van der Vorstb.20世纪基因的特征值计算。2000年。 40[11] Kaiming He，Xiangyu Zhang，Shaoqing Ren和Jian Sun.用于图像识别的深度残差学习。在 IEEE计算机视觉与模式识别会议(CVPR) 论文集中，2016年6月。 60[12] KJ Joseph，Krishnakant Singh，Vineeth NBalasubramanian等. 用于训练深度神经网络的子模批量选择。arXiv预印本arXiv:1906.08771 ，2019年。 50[13] A. J. Joshi，F. Porikli和N. Papanikolopoulos.图像分类的多类主动学习。在2009年IEEE计算机视觉与模式识别会议中，页码为2372-2379，2009年。 60[14] Jogendra Nath Kundu，Naveen Venkat，AmbareeshRevanur，Rahul M V和R. Venkatesh Babu.用于开放集领域自适应的可继承模型。在IEEE/CVF计算机视觉与模式识别会议 (CVPR)论文集中，2020年6月。 10[15] Jogendra Nath Kundu，Naveen Venkat，Rahul M V和R.Venkatesh Babu. 无源领域自适应。在IEEE/CVF计算机视觉与模式识别会议 (CVPR)论文集中，2020年6月。 10[16] Seungmin Lee，Dongwan Kim，Namil Kim和Seong-Gyun Jeong. 适应性特征学习的丢弃。在IEEE/CVF国际计算机视觉会议论文集中，页码为91-100，2019年。 20[17] Da Li和Timothy Hospedales.多源和半监督领域自适应的在线元学习。在欧洲计算机视觉会议中，页码为382-403。Springer，2020年。 20[18] Mingsheng Long，Zhangjie Cao，JianminWang和Michael I Jordan. 条件对抗领域自适应。在神经信息处理系统进展中，页码为1645-1655，2018年。 1 , 5 ,60[19] T. Miyato，S. Maeda，M. Koyama和S. Ishii.虚拟对抗训练：一种用于监督和半监督学习的正则化方法。IEEE模式分析与机器智能交易，41(8):1979–1993，2019年。30[20] George L Nemhauser，Laurence A Wolsey和Marshall LFisher. 最大化子模集函数的近似分析—i. 数学规划，14(1):265–294，1978年。 20[21] Adam Paszke，Sam Gross，Francisco Massa，AdamLerer，James Bradbury，Gregory Chanan，TrevorKilleen，Zeming Lin，Natalia Gimelshein，Luca Antiga，AlbanDesmaison，Andreas Kopf，Edward Yang，ZacharyDeVito，Martin Rai- son，Alykhan Tejani，SasankChilamkurthy，Benoit Steiner，Lu Fang，Junjie Bai和SoumithChintala. Pytorch：一种命令式风格、高性能的深度学习库。在H.Wallach，H. Larochelle，A. Beygelzimer，F. d'Alch´e-Buc，E.Fox和R. Garnett等人的编辑下， Advances in Neural Informa- tionProcessing Systems 32 ，页码为8024-8035。Curran Asso-ciates，Inc.，2019年。 60[22] Xingchao Peng, Qinxun Bai, Xide Xia, Zijun Huang, KateSaenko和Bo Wang. 多源领域自适应的时刻匹配。在IEEE国际计算机视觉会议论文集中，页码为1406-1415，2019年。 70[23] X. Peng，B. Usman，N. Kaushik，D. Wang，J.Hoffman和K. Saenko.Visda：用于视觉领域自适应的合成到真实的基准。在2018年IEEE/CVF计算机视觉与模式识别研讨会 (CVPRW)中，页码为2102-21025，2018年。 60[24] Viraj Prabhu, Arjun Chandrasekaran, Kate Saenko, andJudy Hoffman.通过聚类不确定性加权嵌入进行主动领域自适应，2020年。 30[25] Piyush Rai，Avishek Saha，Hal Daum´e III和SureshVenkatasubramanian. 领域自适应遇见主动学习。在 NAACLHLT 2010年自然语言处理研讨会论文集中，页码为27-32，2010年。 2 , 30[26] Kate Saenko，Brian Kulis，Mario Fritz和TrevorDarrell。将视觉类别模型适应到新领域。在欧洲计算机视觉会议上，第213-226页。Springer，2010年。1，60[27] Kuniaki Saito，Donghyun Kim，Stan Sclaroff，TrevorDarrell和KateSaenko。通过最小最大熵进行半监督领域自适应。在IEEE国际会议上75250计算机视觉会议，第8050-8058页，2019年。1，2，6，70[28] Kuniaki Saito，Yoshitaka Ushiku，Tatsuya Harada和KateSaenko。对抗性丢失正则化。在国际学习表示会议上，2018年。10[29] Kuniaki Saito，Kohei Watanabe，YoshitakaUshiku和TatsuyaHarada。无监督领域自适应的最大分类器差异。在IEEE计算机视觉和模式识别会议论文集中，第3723-3732页，2018年。2，50[30] Ozan Sener和SilvioSavarese。卷积神经网络的主动学习：核心集方法。在国际学习表示会议上，2018年。3，70[31] Ozan Sener，Hyun Oh Song，Ashutosh Saxena和SilvioSavarese。学习可迁移表示用于无监督领域自适应。在神经信息处理系统进展中，第2110-2118页，2016年。50[32] Burr Settles。主动学习文献综述。2009年。1 [33] RuiShu，Hung Bui，Hirokazu Narui和StefanoErmon。一种用于无监督领域自适应的脏数据方法。在国际学习表示会议上，2018年。2，3，50[34] Samarth Sinha，Sayna Ebrahimi和TrevorDarrell。变分对抗主动学习。在IEEE/CVF国际计算机视觉会议论文集中，第5972-5981页，2019年。30[35] Jong-Chyi Su，Yi-Hsuan Tsai，Kihyuk Sohn，BuyuLiu，Subhransu Maji和ManmohanChandraker。主动对抗领域自适应。在IEEE/CVF冬季计算机视觉应用会议上，2020年3月。1，2，3，6，70[36] Simon Tong和DaphneKoller。支持向量机主动学习及其在文本分类中的应用。机器学习研究杂志，2(Nov)：45-66，2001年。40[37] Yi-Hsuan Tsai，Wei-Chih Hung，Samuel Schulter，Ki-hyuk Sohn，Ming-Hsuan Yang和ManmohanChandraker。学习适应语义分割的结构化输出空间。在IEEE计算机视觉和模式识别会议论文集中，第7472-7481页，2018年。10[38] Sergei Vassilvitskii和DavidArthur。k-means++：谨慎种子的优势。在第十八届ACM-SIAM离散算法年会论文集中，第1027-1035页，2006年。70[39] Hemanth Venkateswara，Jose Eusebio，ShayokChakraborty和SethuramanPanchanathan。用于无监督领域自适应的深度哈希网络。在(IEEE)计算机视觉和模式识别(CVPR)会议上，2017年。60[40] Dan Wang和YiShang。一种新的用于深度学习的主动标记方法。在2014年国际神经网络联合会议(IJCNN)上，第112-119页。IEEE，2014年。30[41]Wikipedia贡献者。设施位置问题-维基百科，自由的百科全书，2021年。[在线；访问日期2021年3月17日]。40[42] Donggeun Yoo和In SoKweon。学习损失用于主动学习。在IEEE/CVF计算机视觉和模式识别会议论文集中，第93-102页，2019年。3

下载后可阅读完整内容，剩余1页未读，立即下载