开集域自适应算法：基于反向传播的对抗学习方法

36 浏览量更新于2023-10-13 收藏 1.47MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

基于反向传播的开集域自适应算法斋藤邦昭1[0000 - 0001 - 9446 - 5068]、山本翔平1、牛久义孝1、原田达也1、 21东京大学{ksaito，yamamoto，ushiku，harada}@ mi.t.u-tokyo.ac.jp2理研抽象。已经提出了许多算法，用于将知识从标签丰富的域（源）转移到标签稀缺的域（目标）。它们中的大多数是针对闭集场景提出的，其中源和目标域完全共享其样本的类。然而，在实践中，目标域可以包含由所述目标域所不具有的类的样本。我们将采用“未知类别”，并在操作系统中使用两种方法，这是非常实用的然而，大多数现有的域自适应分布匹配方法在这种情况下不能很好地工作，因为未知的目标样本不应该与源对齐在本文中，我们提出了一种方法，一个开放的集域适应的情况下，利用对抗性训练。该方法允许提取将未知目标与已知目标样本分开的特征在训练过程中，我们为特征生成器分配了两个选项：将目标样本与源已知样本对齐，或者将它们作为未知目标样本拒绝。我们的方法进行了广泛的评估，并优于其他方法，在大多数情况下有很大的利润率。关键词：领域自适应，开集识别，对抗学习1介绍深度神经网络在许多图像识别任务中表现出显著的性能[1]。这种方法的主要问题之一是，基本上，他们不能识别未知的样本，其类是在训练过程中缺席我们将用户帐户视为“未知帐户”，并且在检索过程中出现的数据项将被视为“未知帐户”。”而且，如果在现实世界中工作的机器人能够检测到未知物体，并要求注释者给它们贴上标签，这些机器人将能够轻松扩展知识。因此，开集识别是一个非常重要的问题。在域适应中，我们的目标是从标签丰富的域（源域）训练分类器，并将其应用于标签稀缺的域（目标域）。样品2斋藤、山本、牛久和原田酸ce酸ce源目标背包自行车马克杯未知背包自行车马克杯未知源目标背包自行车马克杯背包自行车马克杯未知Busto等人提出的开集域自适应。开集域自适应Fig. 1.现有的开集域自适应设置与我们的设置之间的比较。左：开集域自适应的现有设置[2]。假设对未知源样本的访问被授予，尽管未知源的类右：我们的设置。我们不假设源域中未知样本的可访问性我们提出了一种方法，可以应用，即使当这样的样品是缺席。在不同的域中具有不同的特性，这些特性降低了在不同域中训练的分类器的性能。大多数关于域自适应的工作假设目标域中的样本必然属于源域的类。然而，这种假设是不现实的。考虑无监督域自适应的设置，其中仅提供未标记的目标样本。我们不能知道目标样本一定属于源域的类，因为它们没有被赋予标签。因此，在领域自适应中也需要采用开对于这个问题，最近提出了称为开集域自适应的任务[2]，其中目标域包含不属于源域中的类的样本，如图2左侧所示1.一、该任务的目标是将未知的大样本分类为“未知的”，并且将其分类为与已知类别相关的小的已知的大样本。他们[2]利用未知源样本将未知目标样本分类为未知。然而，采集未知源样品也是昂贵的，因为我们必须采集多样的和许多的未知源样品以获得“未知源”的概念。“在本论文中，我们提出了一种更具挑战性的开集域自适应（OSDA），它不提供任何未知的源样本，并且我们提出了一种方法。也就是说，我们建议一种方法，其中我们只能访问已知的源样本和未标记的目标样本，用于开集域自适应，如图1的右侧所示1.一、我们如何解决这个问题？我们认为主要有两个问题。首先，在这种情况下，我们不知道哪些样本是未知的样品。因此，似乎很难在知识和知识之间划定界限。这一方案与国内的差异有关。尽管我们需要将目标样本与源样本对准以减小该域的差异，但是由于源域中不存在未知样本，未知样本不能被对准。现有的分布匹配方法主要是针对目标和源的分布进行匹配。然而，这种方法不能应用于我们的问题。在OSDA中，我们必须拒绝未知的目标样本，而不将它们与源对齐。基于反向传播的3源靶未知源目标未知源目标（一）（b）第（1）款（c）第（1）款图二. (a)采用分布匹配方法的闭集域自适应。(b)采用分布匹配方法的开集域自适应。未知样本与已知源样本对齐。(c)：开集域适应与我们提出的方法。我们的方法能够学习可以拒绝未知目标样本的特征为了解决这些问题，我们提出了一种新的对抗学习方法，使生成器能够将目标样本分为已知和未知类。与现有方法的比较如图所示二、与现有的仅匹配源和目标分布的分布对准方法不同，我们的方法便于以高精度拒绝未知目标样本以及已知目标样本与已知源样本的对准。我们假设在我们的方法中有两个参与者，即，特征生成器和分类器。特征生成器从输入生成特征，分类器获取特征并输出K+ 1维概率，其中K表示已知类的数量。输出的K+ 1维表示未知类的概率。分类器被训练成在源样本和目标样本之间形成边界，而特征生成器被训练成使目标样本远离边界。具体来说，我们训练分类器以输出未知类的概率t，其中0

下载后可阅读完整内容，剩余1页未读，立即下载