基于元学习的生成对抗网络在高光谱成像中的开放集识别-MORGAN

100 浏览量更新于2023-10-15 收藏 1.37MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

6295≈MORGAN：基于元学习的生成对抗网络Debabrata1，2，Shirsha Bose3，Biplab Banerjee1，Yogananda Jeppu21印度理工学院，孟买，2霍尼韦尔技术解决方案，印度，3慕尼黑工业大学，德国{deba.iitbcsre19，shirshabosecs，getbiplab，yvjeppu}@ gmail.com摘要在用于高光谱图像（ HSI ）的少镜头开集识别（FSOSR）中，由于光谱细粒度已知类和离群值的同时存在而产生一个以往的生成式FSOSR研究不能处理这种情况，因为它们不能谨慎地逼近开放空间。为了解决这个问题，我们提出了一种方法，基于元学习的开放集识别通过生成对抗网络（MOR-GAN），可以学习封闭和开放空间之间的更精细的分离。MORGAN试图通过明智地调整噪声方差，同时使用新型抗重叠潜伏期（AOL）正则化器确保区分能力，使用两个GAN在几次射击制度中为封闭空间和开放空间生成类条件对抗样本。来自低噪声方差的对抗样本放大了已知类的数据密度，我们使用来自高噪声方差的样本来增加“已知-未知”。一阶情节策略被适配以确保GAN训练中的稳定性。最后，我们引入了一个组合的metric损失，推动这些增强的在四个基准HSI数据集上进行的大量实验表明，MORGAN一致地实现了最先进的FSOSR性能。11. 介绍高光谱成像（HSI）传感器在大量的实际应用中以密集采样的宽波长范围捕获来自地球表面的材料反射率在传统的闭集HSI分类的情况下，像素基于其光谱-空间属性被分配到可用的已知类中的一个。然而，HSI数据集本质上对某些已知类别的有限训练数据可用性提出了警告，1https://github.com/DebabrataPal7/MORGAN图1. (a)显示了Salinas HSI数据集的原始图像。(b)已知类别的带注释土地覆盖图按实际地面实况显示。(c)另一个开放类被进一步注释为现有的已知类，这些已知类经常被错误地识别为已知类之一。宽范围的光谱带被称为“维度灾难”[4]。最近在少数镜头学习（FSL）[35，7，23]方面的进展已经成为许多计算机视觉应用中弥合这一差距的事实标准。FSL也已成功地用于HSI分类[25]机器学习和基于深度学习的方法[18，28]。然而，闭集训练模型在现实场景中的测试期间容易遇到离群值，这是由于i）部署在新的地理区域中，ii）由于HSI标记中涉及的成本而存在未注释的已知类像素很明显，一个可靠的HSI分类器除了其原始的已知类分布知识之外，还应该知道离群值。因此，HSI数据集的FSOSR的出现在地球科学界引起了越来越多的兴趣[1，21，26]（图11）。①的人。现有的OSR [2，8，11]和FSOSR [13，20]方法倾向于对模型预测应用经验阈值，以将离群值与已知类别区分开来。实际上，使用这样的阈值似乎令人沮丧一种纯粹依赖于网络的方法。由于最近引入的异常值校准网络（OCN）[26]，发现一种三层二元分类器可以元学习已知值和异常值之间的伪决策边界，从而提高FSOSR性能。有趣的是，当我们深入研究[26]时，我们发现10%的低开率活泼比封闭设置为5杆评价印度Pines数据集，即观察到严重的错误分类，6296开放类很明显，[26]不能处理细粒度类可能同时存在于闭集和开集中的情况。我们怀疑这是由于[26]的泛化能力有限，因为它从可用的基类中元学习了一个闭集边界，而没有注意近似开放空间的广泛知识。这总是影响HSI中的开集分类性能。对于开放空间和封闭空间的精细分离，我们认为有代表性的开放样本的存在与封闭集数据的各种相似性措施是必要的。这就引出了我们的第一个研究问题：如何从可用的闭集数据中产生细粒度的开放空间样本，以便更好地学习FSOSR中的已知-未知类分隔符？到目前为止，使用GAN [27]的生成模态幻觉技术遵循完全监督的方法并生成分布数据。当然，它们不能在少量训练模式下进行最佳训练，因为从少量训练样本中估计数据密度非常困难。此外，它们遵循闭集模型，不能执行开放空间数据合成。这促使我们提出下一个研究问题，即如何稳定地训练GAN模型，以便从少数可用的闭集训练样本中同时合成闭集和开集样本？最后，我们寻求为闭集样本获得一个密集的和有区别的特征空间，同时确保生成的开放空间样本分散在一个区域上。这将保证模型更好地估计开放空间分布在这方面，[26]确保了有区别的闭集表示;然而，在[26]中忽略了开放空间散布，因为它没有明确地模拟开放空间分布。这就引出了第三个研究方向，即在FSOSR中同时确保开放空间的区别性封闭集分布和多样性。我们的贡献：为了解决上述问题，我们提出了一种新的基于双条件GAN的生成模型，称为MORGAN，其中使用两个不同的噪声变化值来对“伪已知”和“已知-未知”样本进行幻觉我们建议使用“伪已知”特征来增强闭集数据，这些特征是并行地，我们从高噪声方差中训练然后，一种新的AOL正则化器通过限制已知-未知生成器从低噪声方差和高噪声方差的非重叠区域合成样本来断言这些伪已知特征和离群值之间的可区分性。基于元学习的Reptile [23]，在我们的MORGAN框架中同时生成伪封闭和开放样本。学习拒绝这些细粒度的类特定的离群值收紧了已知的类原型，并对已知的类分布施加了约束，以跨越度量空间中此外，而不是只增加人口密度每个已知的类，我们假设，开放空间的风险进一步最小化分散细粒度的边界离群值到一个开放空间。为了执行相同的操作，我们引入了离群值散射损失来最大化细粒度伪离群值和闭集分布之间的分离。除此之外，我们的贡献概述如下：- 为了提高FSOSR中的数据密度，我们开发了一种基于Meta学习的方法MORGAN，该方法通过模拟控制低噪声方差和高噪声方差来同时生成类条件伪已知特征和此外，一个新的正则化，AOL，提出了从生成的伪已知功能区分伪离群值。- 我们采用基于情景一阶优化的 Meta 学习来稳定GAN。此外，我们提出了一个基于原型的离群点散射损失，以最大限度地提高闭集边界和开放空间之间的分离和合并其他度量损失，以优化特征提取。- 提出的MORGAN模型是一个轻量级的模型，并得到优化速度更快，我们已经在定性分析。我们通过将一些光谱相似的类分配为开闭对来进行广泛的实验，从而学会拒绝基准HSI数据集2上的细粒度离群值，即Indian Pines，Pavia，Salinas和Houston-2013。2. 相关作品少拍开集识别：在PEELER [20]中尝试通过形成具有有限支持集的高斯聚类来解决FSOSR问题。即使闭集分布学习得很好，离群值也不会被推离原型，无法拒绝光谱细粒度离群值。SnaTCHer [13]对原始原型和查询替换的转换原型之间的差异进行阈值化，以找到离群值。HSI上的当代FSOSR方法[1，21]应用阈值来拒绝离群值。然而，这是很难找到一个最佳的阈值，以拒绝与已知的土地覆盖样本的边际光谱差异再次，倒易点分类损失[3]滞后于FSL中的紧凑已知类分布，导致较低的闭集精度。因此，我们假设需要对抗性特征增强来同时提升FSOSR上下文中的已知生成开集识别：一个细粒度的开集分类器必须知道丰富的闭集分布，并在开放空间上很好。现有生成OSRponents。为了稳定来自几个样本的GAN训练我们建议整合情景一阶优化，2http://www.ehu.eus/ccwintco/index.php/Hyperspectral遥感场景6297∈图2.建议摩根的框架工作。首先，特征提取器（fφ）产生已知类的支持特征Sf和已知类和伪未知类的组合的查询特征Qf。然后，一个adversarial过程优化从各向同性高斯采样的一个late向量，以产生伪已知特征sl由生成器（GLθ）。用Sf扩充sl以丰富闭集分布，并计算原型P。为了丰富开放空间，我们通过采样另一个高斯噪声，使用从Generator（GHθ）获得的s h来增强查询特征。离群点检测器（O）根据查询集Qaug与P的欧氏距离Qdist将查询分类为离群点。对于已知的查询预测，我们通过在Qdist上应用softmax来获得它的类。方法分开优先级1）基于重建误差的离群值拒绝[5，33，29] 2）伪开集生成[8，22]，和3）闭集分布富集[31，37]。主要生成OSR方法应用GAN [16]或自动编码器[24]，利用大规模训练数据集。类条件自动编码器（C2AE）[24]遭受来自训练集的已知样本选择偏差，以在已知样本上获得OpenGAN [16]增加了虚假功能，并惩罚了学习拒绝离群值的方法我们强烈认为，所有的敌对样本并不总是离群值;它们也可以是已知的类代表样本。生成FSOSR的基本挑战是GAN从有限的训练数据中的非收敛性[6]。所采用的培训战略3. 拟议方法3.1. 预赛FSOSR解决了开放集识别的问题，只有几个已知的训练样本。准确地说，Meta学习器学习使用情节策略拒绝离群值以及已知类样本的准确分类。为此，元学习者探索两个不相交的类集合，用于元训练的基类和用于元测试的目标类我们选择一个随机的基类子集作为已知-未知来丰富开放空间，其余的作为已知类。对于给定的K个已知类，每个类具有m个训练样本，我们将支持集表示为S={（xs，y s）}m。K也是摩根似乎在这方面有所帮助。称为K路ii i=1少数镜头特征幻觉：[19]第十九话m-镜头分类。同样，我们形成查询集为Q={（x q，y q）}N。（K U），N个样本只吃伪已知的样本，通过快速适应新从每个Kjjj=1U域使用基于优化的元学习，即MAML [7]和Reptile [23]，但它不能生成分布外数据。MetaGAN [38]仅生成用于少数镜头分类的假数据，FAML [30]通过使用无监督元学习将两个噪声向量与特征向量连接来生成假图像。D2GAN [17]引入了一个抗崩溃正则化器，以在少数情况下保持可区分性和多样性该正则化器将生成的对抗样本之间的对数相似性F2GAN [12]中融合输入图像与随机插值系数的策略可以生成任意的土地覆盖类别。FSGAN [32]从StyleGAN2 [14]上执行的奇异值分解[10]中放大与年龄、姿势、肤色相关的奇异值然而，在HSI数据集的端元的范围是无限的，导致棘手的奇异值。已知类和已知-未知类。xs，xqRH×W×B表示高度的3D HSI块H、宽度W、谱带B和ys、yq分别表示关联的支持集和查询集标签3.2. MORGAN组件本节将首先介绍网络体系结构。因此，我们解释了一个少数镜头类的概念-条件封闭和开放的功能生成策略。最后，我们讨论了AOL正则化器的思想，以拒绝重叠细粒度伪离群值。A. 网络架构：图2显示了MORGAN的模型架构。考虑到3D HSI补丁作为输入，我们选择来自OCN [26]的R3CBAM作为骨干特征提取器（fφ），因为它在基于注意力的CBAM 3D层的帮助下具有优越的频谱-空间HSI特征学习能力。fφ产生64D特征向量。我们构造两个摩根生成器，即，GLθ，6298PSSSOSQUS KQOO{N} − {N}SNO⊂L L∥ ∥ ∥ ∥GHθ，使用三个连续的密集层，ReLU激活具有32，48和64个单元。在元训练期间，我们用支持特征（f）来增强由GL θ产生的伪已知特征（s l），以更好地近似闭集分布，其中f是通过f φ获得的。通过计算增广闭集特征的类平均值来度量已知类原型f（）s l.类似地，查询特征（f）通过细粒度的伪开放样本（s h）被GHθ增强，以获得更好的开放空间估计。鉴别器DL、DH有五个密集层，ReLU激活有48、32、16、8和1个单位。DL分类器的目标是将输入特征分类为实Sf或伪已知S l，而DH分类器将输入特征分类为实f或伪离群S h。我们使用具有三个密集层的二元分类器作为离群值检测器，所述三个ξ. 在元训练过程中，学习拒绝离群值f（）s h。最后，在元测试期间，未标记的查询首先被预测为离群值或已知样本。在已知预测的情况下，估计其类基于与原型PB. FSL中的条件开闭特征生成：在文献中，D2 GAN[17]中的生成器利用两个噪声向量产生不同的闭集样本。相比之下，我们对两个噪声向量进行采样，以使用分别负责闭集和开放空间富集的双GAN生成伪闭和开放样本然而，GAN元学习的根本挑战是从有限的训练数据中获得足够的梯度同样，GAN从未知的概率分布中生成对抗样本，该概率分布没有使用封闭形式的似然函数进行优化Dawson [19]调用基于优化的图3.（ a）从重叠分布采样噪声向量导致伪开闭特征的模式崩溃。AOL正则化器惩罚GHθ，使其从各向同性高斯互斥区域采样的噪声向量中生成sh，（b）z l，z h接近度在确定理想λ AOL限值中的作用。样品本质上， GHθ 应该利用从（ 0 ， σH ）（ 0 ， σL ）区域。3a，或s h应该从各向同性高斯分布的标准偏差（σL< σ< H）的噪声向量产生。为了使它在数学上可行，我们提出了AOL正则化器，旨在产生不相交的sl，sh。C. 抗重叠潜在正则化器：为了解开重叠的噪声向量，可以产生对抗性离群值s h，其具有与伪已知样本s l的特征表示等效的特征表示，我们定义AOL正则化器。据我们所知，我们是第一个在生成网络中引入一种新的正则化器来控制解纠缠特征的人。从重叠噪声方差生成具体而言，我们对z l、z h进行采样，并从该类别的两个生成器生成合成特征，即， sl=GLθ（Sf，zl）和sh=GHθ（f，zh）.因为，zlz h，一些s h样本预期被折叠到sl的相同模式。为了解决这个问题，我们定义AOL正则化项，λAOL（zl，zh，sl，sh）=（1+cos（zl，zh））.max（λ，cos（sl，sh））元学习来连接GAN哪里I.J（一）在FSL范例中获得梯度受[19]的启发，我们还采用基于一阶优化的元学习来训练MORGAN双条件GAN用于FSOSR任务。GLθ使用从一般各向同性高斯[N（0，σL）]采样的噪声向量z l。由于σL的低噪声变化，DL惩罚GLθ以生成稍微虚假的已知特征s l，使得用Sf扩充s l提升闭集表示。类似地，DHθ惩罚GH θ，G Hθ从另一个各向同性高斯分布（0，σH）接收潜向量zh，并产生高度虚假的特征s h，其中σH> σL。我们认为s h是伪未知数。在元训练过程中，学习将s h作为离群值拒绝，并且直观地，它使每个已知的类分布跨越度量空间中的封闭边界。此外，由于从高斯分布生成sl，因此根据CAP[34]理论，增强闭集样本的概率从其原型降低。因此，在FSOSR中建立了每个已知类别分布的判别边界。用zlzh训练两个不相交的生成器，可以产生重叠的伪已知和伪离群cos（i，j）=i2j2表示向量i，j之间的余弦相似性，并且π是一个小的正常数。由于预测方差的固有边界性质，我们在制定λ AOL时考虑余弦相似性[9]，从而使经验风险最小化。 λ AOL针对敌对特征s l、s h之间的相似性惩罚G H θ，当它们对应的噪声向量z l、z h变得非常相似时。在优化（2）中的GHθ，DHθ参数时，我们使λ AOL最小。这个正则化器的效果可以在图中可视化3b. 如果不使用它，从重叠分布中采样的zl，zh会降低sl，sh之间的区分度。3.3. 学习和推理协议对于每个随机采样的情节，我们通过特征提取器fφ提取Sf和Qf。然后，在算法2中，我们分别针对损失函数l、H优化MOR-GAN生成器GLθ、GHθ和鉴别器DLθ、DHθ。生成的对抗样本被增强以丰富封闭和开放空间。我们计算三个损失分量LFE的总和，考虑i）已知类压缩损失LKc，ii）离群散射损失LOs和iii）6299O LLSL我我SL|SHfLI联系我们∈{}LLL L HHL L LLO LLPQ∇ ∇ ∇∇L L HH2QQ QOOSPQ ← P − QϕÛθÛϕθ我事件结束时的异常值校准损失Oc。最后，我们对Oc和FE分别进行了最优化. MORGAN元学习的步骤如算法1所示。条件GAN的元学习对于几次分类任务，Reptile [23]使用新采样的事件计算其先前训练的版本和最新训练的版本之间的模型权重差，并执行一阶优化。Reptile通过从有限的数据中生成良好的梯度来快速优化特定于任务的参数。在MORGAN中，一阶Reptile [23]用于在二阶MAML [7]上优化双条件GAN。Ll=minmaxEsS[lo gDL（s|y）]算法一：MORGAN元学习步骤输入：S（K），Q（K <$U），ys，y q，f φ，Oθ，GLθ，GHθ，DL，DH，σL，σH，βL，βH，迭代次数：o，i，InnerLoop学习率：αL，αH元培训阶段：1 提取特征：Sf<$fφ（S（K）），Qf<$fφ（Q（K<$U））;2训练GAN：随机初始化Lθ，Lθ，Hθ，Hθ和样本集τS（K）;fori←1 toIo do2.1 克隆参数：DL←DL，GLθDLSD.H. ←DH ，GLθ ←GLθ ，GHθ ←GHθ;+Ez<$N （0，σL）[lo g（1− DL<$（GLθ（z|y）];h=min maxEs[logD（s y）]GHθDH θ2.2 DL，Gθ，DLθ，GLθ，αL，i，τ，σL，0，0）;2.3S+E[log（1 − D（G（z|y）] + λ（二）DH，z<$N（0，σH）HθAOLG、D，G ，αH，I，τ，σH，s，z）;哪里，L，L是对抗性的损失，，S.HθHHθilLh l h l2.4 用βL，βH更新Lθ，Lθ，Hθ，Hθ（3）;为了优化（2）中的MORGAN目标，我们在算法2中使用随机梯度下降初始更新GAN模型参数的克隆副本。基于输入噪声向量zzl，zh，内部循环生成sl或sh。我们为optimiz中的输入s和z分配零值设G θ，D θ为零，并以10，1为指示函数，当且仅当[s = z = 0]时，λ AOL在（2）中的L1计算中为零.λ AOL（z，z′，s，s′）只惩罚GHθ和DHθ，因为当[sθ= 0，z 0]时1被设为1. Fi-3 增广闭集分布并计算（4）;4针对细粒度开放空间的扩充查询aug5计算FE（8）使用Kc（5），Os（6），Oc（7）;6分别用 Oc 、 FE优化φ、fφ。return更新参数φ，θ;元测试阶段：输出：测试集查询样本7Sf<$fφ（S（K）），Qf<$fφ（Q（K <$U））;最后，这些梯度被返回到算法1以更新鉴别器和发生器的原始参数为，H< $H< $−βH × <$DH;Hθ <$H θ−βH × <$GHL<$L<$−βL× <$DL;Lθ<$Lθ−βL× <$GL（3）其中，θ，β，θ是模型参数，βL，βH是学习率，DL， GL， DH，GH是内环内获得的梯度。8将f传递给GLθ，增加支持度并计算;9计算查询距离：distf2;10通过将dist传递给dist来对f个样本进行分类如果MySQL将查询分类为已知，则通过在dist上应用softmax来预测类;其他将查询分类为离群值;返回查询样本的Predicted类;估计原型：我们利用生成的sl来丰富闭集分布。然后，我们计算增广支持特征的类平均值，以估计单个已知类原型Pk。此外，为了优化离群散射损失，我们计算开放空间原型算法二：MORGAN内环训练输入：D，G：，D，G，α，I，τ，σ，s，z使用known-unknown查询。输出：D，G，s′：新的对抗样本，z′1随机抽取K个样本{s1，...，sK}<$qτi;1先令1先令q我J2fori←1toIidoPk=mxs∈Skfφ（xi）≠sl;PU=Nxq∈Q（U）fφ（xj）<$sh;（四）对于k←1到K做2.1 s′←Gθ<$（z′），其中z′<$N（0，σ）;2.2 更新Dθ和Gθ参数：其中Sk是第k个已知类的实支撑集D′特征提取器和离群值检测器优化：我们更新f φ的目标函数是三倍损失分量的积分，专注于每个已知类分布密度最大化，细粒度伪离群值识别，并将它们从闭集分布中分散出来。我们用伪离群值来增加已知-未知查询，以增加开集数据密度并计算Qaug中每个查询的损失，其中，Qaug←Qf（U）≤ h。F6300θ，θθ（sk，s）+1.λAOL）;θ<$−θ−α×λ<$（LG<$（s′）+1.λAOL）;2.3 计算：D<$−，G <$θ−θ;returnD，G，s′，z′6301×ΣKPPP∈ Q×ΣKP.T. P+TNkk土耳其+1T +TN+F P +FNkkk k∈ QS∈ Q KOQO2±联系我们i.已知等级压实损失：维护每个已知类的压缩表示需要最小化每个已知查询和支持特征与相应原型的距离。（5）中针对每个已知查询的欧几里德距离的优化e−d（q，Py）4. 实验4.1. 数据集和预处理我们在四个基准HSI数据集上评估MORGAN使用AVIRIS传感器，印第安纳州西北部的印第安松（IP）数据集。IP有145 - 145像素，220个波段，覆盖16个土地覆盖类。在加利福尼亚州萨利纳斯谷捕获的萨利纳斯，涵盖16个标记类。它具有512×217的空间维度，204个光谱带。LKc=Eq∈Qf（K）<$Sf<$sl— 日志k=1 e−d（q，Pk）（五）帕维亚大学数据集使用ROSIS sen捕获对具有610×610像素的九个土地覆盖类进行排序，其中，y是查询q的真实原型，d是平方欧氏距离ii.离群值散射损失：为了从已知类分布中散射离群值查询aug，应该最大化该查询与已知类真实原型y的度量距离。实际上，它最小化了该查询属于该已知类的概率然而，在多类分类中，仅仅从一组已知类中排斥离群点会导致离群点在度量空间中的不确定性因此，我们将这些离群值拉向开放空间原型U，并获得可转移的知识以分散在情节上。此外，惩罚非参数原型有助于一组离群值共同快速地向开放空间移动，以最大化分离裕度。因此，我们尽量减少错误的风险-将细粒度离群值分类到已知实例。103个乐队。我们考虑在[21]中为FSOSR注释的一个Salinas和六个Pavia类。Houston-2013数据集有349个1905像素，144个波段，在休斯顿大学捕获了15个土地覆盖类。我们在IP、Pavia和Salinas数据集上应用PCA [36]，将休斯顿数据集的光谱维度减少到30个波段和10个波段，保留了单个数据集99%的数据变异性然后，我们使用零填充在每个像素位置处对维度为（11，11，ch）的立方体块进行切片，其中ch表示频谱带的数量。4.2. 评估指标为了评估MORGAN的性能，我们使用标准OSR指标，即封闭式总体准确度（Closed- dOA）、开放式总体准确度（OpenOA）和AUROC（受试者工作特征曲线下面积）。 ClosedOA 表示正确分类的已知类OpenOA评估模型在pres-LOs=Eq∈Qaug— 日志k=1eγd（q，Py）eγd（q，Pk）+e−d（q，PU）（六）AUROC是指在各种阈值配置下的离群值检测能力。其中，γ是控制离群查询∈Qaug到Py的距离的正排斥因子。K+1OpenOA=k=1k=1（九）iii.离群值校准损失：我们将每个查询的欧氏距离（dist）从原型传递到查询。在每一个事件中，学习者学习一个可转移的知识，将查询f（）分类为已知样本，将查询aug分类为离群值。虽然f，s l可能是classi-如已知的那样，我们在实验上发现，通过包括Sf，Sl，没有显著的性能改善。使用交叉熵损失，优化无阈值的O_∞参数其中，TP k、TN k、FP k、FN k分别表示第k个已知类的真阳性、真阴性、假阳性和假阴性。在OpenOA中，所有的异常值被合并为K+ 1类.4.3. 实验方案在元训练期间，我们为每个数据集选择10个随机类作为基类，并将剩余的类LOc=Eq∈Qf（K）−Σi=1 tilog（O（Qdist）i）（7）元测试同样，我们将基类拆分为spectrally细粒度的开闭类对。然后，我们形成一个查询集，每个类15个样本，从六个随机选择，我在哪0，1是已知或离群类的标签。总特征提取器损失：最后，我们计算总损失函数以优化（8）中的fφ参数LFE=LKc+LOs+LOc（8）推理策略：我们从原型中测量目标查询的Q dist。Odist基于输入Q dist将其分类为已知或离群值。在已知类别预测的情况下，通过在Qdist上应用softmax来进一步获得其类别。ΣΣ6302senbase classes.此外，支持集由来自三个随机查询类中的每一个的m个不相交样本形成我们使用Adam优化器[15]，算法1中βL，βH的学习率为0.0001，算法2中αL，αH的学习我们在（6）中将γ设为1，在（1）中将σL设为0.00001，将σH设为0.2和1.0（参见表4）。在测试过程中，我们根据文献从目标类别中随机抽取500次事件，并将平均标准差结果记录在表1和表2中，以进行可靠的预测。所有的方法进行了比较，使用相同的实验设置。6303表1.MORGAN和SOTA方法在高光谱数据集上的单次FSOSR性能比较模型印度松帕维亚大学萨利纳斯休斯顿-2013年关闭OAOpenOAAUROC关闭OAOpenOAAUROC关闭OAOpenOAAUROC关闭OAOpenOAAUROCOpenMax [2]RDOSR [1][21]第二十一话43.33±0.6351.28±0.3446.15±0.2148.54±0.2950.13±0.4146.50±0.2344.44±0.3347.29±0.2348.66±0.3252.08±0.5350.85±0.2756.66±0.2254.61±0.2151.68±0.3254.89±0.2152.22±0.3555.45±0.4251.11±0.3451.92±0.5259.14±0.3558.33±0.2142.50±0.2360.19±0.3357.28±0.3150.33±0.3454.23±0.2152.77±0.3237.50±0.7358.92±0.2741.66±0.4331.33±0.7163.53±0.5143.42±0.3436.11±0.3361.08±0.3443.88±0.32[20]第二十话[13]第十三话OCN [26]71.41±0.3189.33±0.1180.67±0.6375.45±0.2481.25±0.2382.72±0.3471.84±0.2174.53±0.3275.93±0.3257.18±0.3558.50±0.2959.50±0.2171.55±0.3175.57±0.3484.77±0.3452.39±0.1850.35±0.3389.96±0.4365.14±0.5365.94±0.6782.64±0.3169.63±0.4378.91±0.2874.27±0.3257.78±0.3353.88±0.4381.36±0.2146.95±0.4158.73±0.3560.84±0.3274.34±0.1777.42±0.3378.93±0.4653.75±0.3248.05±0.3474.26±0.17摩根[我们的]91.47± 0.1487.42± 0.0890.83± 0.1279.88± 0.1685.22± 0.2190.11± 0.0983.24± 0.1790.22± 0.1491.96± 0.1277.15± 0.2289.20± 0.1591.06± 0.12表2.MORGAN和SOTA方法在高光谱数据集上的5次FSOSR性能比较模型印度松帕维亚大学萨利纳斯休斯顿-2013年关闭OAOpenOAAUROC关闭OAOpenOAAUROC关闭OAOpenOAAUROC关闭OAOpenOAAUROCOpenMax [2]RDOSR [1][21]第二十一话51.92±0.3455.98±0.5150.76±0.5358.33±0.5155.92±0.4546.96±0.3555.62±0.4652.38±0.5264.51±0.5169.17±0.3264.74±0.4565.33±0.2558.12±0.5364.89±0.3462.66±0.1953.36±0.5363.94±0.3748.66±0.4169.23±0.2567.80±0.3575.01±0.3758.12±0.3566.32±0.5162.66±0.3455.44±0.3460.28±0.4772.88±0.2241.66±0.2468.82±0.5246.66±0.2135.64±0.3566.37±0.3144.42±0.2337.84±0.5162.56±0.4346.22±0.33[20]第二十话[13]第十三话OCN [26]82.81±0.3992.00±0.5194.61±0.3887.37±0.3489.42±0.4584.71±0.5174.19±0.2576.05±0.5588.40±0.3860.71±0.2374.91±0.3571.55±0.3272.69±0.5378.10±0.3887.94±0.3460.36±0.5154.98±0.2991.90±0.4574.20±0.5274.21±0.5484.88±0.3775.39±0.3183.15±0.3985.61±0.3960.39±0.3672.11±0.4388.52±0.3457.98±0.4769.24±0.3471.97±0.2975.57±0.5783.29±0.5284.96±0.4855.47±0.3449.09±0.4588.50±0.47摩根[我们的]95.09± 0.1890.43± 0.2495.59± 0.1281.11± 0.1992.18± 0.1892.98± 0.1486.64± 0.0993.70± 0.1194.99± 0.1183.64± 0.2192.18± 0.1495.17± 0.16图4. 5-在四个基准HSI数据集上使用不同的FSOSR方法进行AUROC比较。MORGAN（以“红色”表示图5.通过SOTA方法比较5次FSOSR分类图，即（b）PEELER（c）SnaTCHer（d）OCN，以及（e）在（上）萨利纳斯（中）帕维亚大学和（下）印度松树上的MORGAN在（a）中显示了每个数据集的基础事实4.4. 实验结果我们将MORGAN与最先进的（SOTA）1次和5次FSOSR方法进行了比较，分别见表1和表2。由于MORGANOpenMax [2]和MDL4OW [21]最初是为大规模OSR开发的，通过在原型网络[35]中拟合Weibull分布，RDOSR[1]使用有限的监督样本在潜在空间中对HSI数据集执行OSR。PEELER [20]、SnaTCHer [13]和OCN [26]是针对FSOSR背景开发的，并且易于在HSI数据集上进行评估。对于单次FSOSR，我们看到MORGAN以4.7%的 OpenOA ， 14.9% 的 AUROC 超过 IP ， 20.38% 的ClosedOA 超过 Pavia ， 11.31% 的 OpenOA ， 10.6% 的AUROC超过Salinas，16.31%的ClosedOA，10.27%的OpenOA，16.8%的AUROC超过Houston-2013数据集。5次拍摄的FSOSR性能也被摩根看好。在IP上，它比其他方法提高了7.19%的AUROC总的来说，MOR-GAN达到了图1中ROC曲线下的最大面积。4反映了在少数情况下的高细粒度离群值识别能力。分类图比较图。5.PEELER和SnaTCHer错误地将萨利纳斯和帕维亚的一些已知类别MORGAN识别细粒度公开课的IP中的闭集识别性能在MORGAN中也是优越的.像6304O表3.对我们的各种创新进行消融研究，以优化MORGAN模型印度松帕维亚大学萨利纳斯休斯顿-2013年关闭OAOpenOAAUROC关闭OAOpenOAAUROC关闭OAOpenOAAUROC关闭OAOpenOAAUROC无LO88.31±0.3783.39±0.2980.32±0.4580.22±0.2877.54±0.3782.43±0.2281.75±0.2886.55±0.3191.79±0.3081.48±0.2986.57±0.3190.34±0.25没有AOL94.57±0.3986.71±0.2589.45±0.3779.34±0.3384.28±0.2788.26±0.2383.58±0.3487.31±0.4488.23±0.2680.11±0.2887.23±0.2688.33±0.35没有干80.33±0.2681.27±0.2380.55±0.3071.78±0.2486.85±0.3584.37±0.3574.80±0.2282.88±0.2086.71±0.3674.50±0.3782.19±0.4286.71±0.22内部循环-MAML[7]90.71±0.4384.60±0.2488.29±0.2280.59±0.2581.96±0.3974.73±0.2784.35±0.2886.85±0.2195.81± 0.1081.98±0.4588.69±0.3589.65±0.27摩根[我们的]95.09± 0.1890.43± 0.24 95.59± 0.1281.11± 0.19 92.18± 0.1892.98± 0.1486.64± 0.0993.70± 0.1194.99±0.1183.64± 0.2192.18± 0.1495.17± 0.16图6.由于针对IP数据集上的各种损失分量优化了MORGAN，因此可以实现度量空间的t-SNE可视化4.5. 进一步分析不同损失成分的影响：在表 3 中，我们观察到MORGAN 获得了 IP 的 7.04% OpenOA ， 14.64%OpenOA ， Pavia 的 10.55% AUROC ， Salinas 的 7.15%OpenOA，包括离群值散射损失。图6示出了结合不同损失函数来训练MORGAN的t-SNE图当仅通过压缩损失进行优化时，一些细粒度的离群值落在图1中的闭集分布内。6a.消除散射损失创建了一个紧凑的决策边界分离已知和细粒度的离群值对，在图。6b.进一步的异常值校准损失有助于更好地区分图中的异常值。6c.第二个例子。AOL正则化剂的影响：AOL正则化器生成包含已知类分布的细粒度离群值。对于表3中的IP、Pavia和Salinas数据集，它分别帮助提高了3.72%、7.9%、6.39%的OpenOA和6.14%、4.72%、7.76%的AUROC。功能生成的影响：我们评估了MORGAN，没有生成任何对抗性的已知和伪离群值。然而，与表3中的对抗性特征增强策略相比，我们观察到IP的ClosedOA下降了14.76% ， OpenOA 下降了 9.16% ， AUROC 下降了15.04%空间复杂度：摩根是一个相当轻量级的模型。发生器GLθ、GHθ只有5520个参数，而判别器DLθ、DHθ分别有6129个参数.特征提取器（fφ）是所有比较方法共有的38，114个参数，特征提取器（f φ）有218个参数。时间复杂度：MORGAN中的双GAN通过算法2中基于Reptile的一阶元学习[23]进行了优化，在图7c中产生了最快的损失收敛。OCN [26]显示了相当长的收敛时间，而基于MAML [7]的MORGAN由于二阶优化而遭受波动。利用Reptile，准确度也提高了10.22% OpenOA，Pavia的AU-ROC提高了17.45%，Houston数据集的AUROC提高了5.5%，如表3所示。然而，MAML对于Salinas数据集来说稍微好一点，AUROC增加了0.82%。图7.Salinas上空5次FSOSR损失衰减比较，(a)[26]，MORGAN与（b）MAML [7]和（c）Reptile[23]。表4.噪声方差（σL，σH）值5次FSOSR任务的Indian Pines数据集上的GLθ、GHθ噪声方差印

下载后可阅读完整内容，剩余1页未读，立即下载