没有合适的资源?快使用搜索试试~ 我知道了~
BoostMIS:基于自适应伪标记和信息主动标注的医学图像SSL方法
120666BoostMIS:利用自适应伪标记和信息主动标注张文乔1朱磊1James Hallinan2,*张胜宇3Andrew Makmur2蔡庆鹏1Beng Chin Ooi11新加坡国立大学2新加坡国立大学医院3中国浙江大学wenqiao@nus.edu.sg,e0203764@u.nus.edu,{james hallinan,andrew makmur}@nuhs.edu.sg,syzhang@zju.edu.cn,{qingpeng,ooibc}@ comp.nus.edu.sg摘要本 文 提 出 了 一 种 新 的 半 监 督 学 习 ( SSL ) 框 架BoostMIS,该框架结合了自适应伪标记和信息主动标注,充分发挥了医学图像SSL模型的潜力:(1)BoostMIS能够根据当前学习状态自适应地利用聚类假设和未标记数据的一致性正则化。该策略可以自适应地生成从任务模型预测转换的独热“硬”标签,以用于更好的任务模型训练。(2)对于未选择的未标记的图像与低置信度,我们引入了一个主动学习(AL)算法,通过利用虚拟对抗扰动和模型的密度感知熵来找到信息丰富的样本作为注释候选人。这些信息候选者随后被馈送到下一个训练周期,以更好地进行SSL标签传播。值得注意的是,自适应伪标记和信息主动注释形成了相互协作的学习闭环,以提高医学图像SSL。为了验证所提出的方法的有效性,我们收集了转移性硬膜外脊髓压迫(MESCC)数据集,旨在优化MESCC诊断和分类,以改善专家转诊和治疗。我们在MESCC数据集上进行了广泛的BoostMIS实验研究。实验结果验证了我们的框架我们的工作可以在github1上找到。1. 介绍近年来,深度学习的发展为计算机视觉领域带来繁荣[26,27,29,29,30,32,54,571https://github.com/wannature/BoostMIS*通讯作者。标记数据任务模型伪标记培训SSL阈值培训AL决策边界注释SSL决策边界信息选择代表数据池样本 人类专家未选择的数据图1.AL如何促进医学图像SSL的示例。橙色和绿色的点表示数据池中的两个不同类。灰点表示未标记的数据。红色和蓝色标记指示注释候选,其可以分别平滑决策边界和将代表性标签信息传播到未标记的数据。31、46、52、56]。例如,医疗保健领域的一个重要趋势是利用深度学习技术[7,19,40,49,55,62]来利用大量注释良好的数据集来实现自动化医学图像分析。然而,注释这样的医疗数据集是面向专家的、昂贵的且耗时的任务。大量新的没有标签的原始医学图像进一步加剧了这种情况。这些是在临床实践中每天产生的,并且对利用这些数据的需求越来越大。因此,通过利用有限数量的标记数据以及大量原始未标记数据来超越传统监督学习的半监督学习(SSL)正在获得关注。在现有的SSL方法中,伪标签[25]是一种特定的变量,其中模型预测被转换为伪标签,这通常与基于置信度的阈值一起使用,仅当分类器足够自信时才保留未标记的示例他们中的一些人[4,24,42,50],120667在CIFAR-10/100等图像分类数据集上取得了巨大成功[23],证明了利用未标记数据的潜在价值不幸的是,这些基于自然图像的伪标记SSL方法可能不能令人满意地解决医学成像问题,这可以概括为两个关键方面:(1)较差的数据利用率。医学图像(例如,CT、MRI)在像素水平上高度相似,这使得它们很难分类,即使是人类。也就是说,伪标记可能仅产生具有高于未标记医学图像的固定阈值的高置信度的少数伪标记,特别是在训练过程的早期阶段。它存在数据利用率低的问题,即大量的未标记数据被忽略。(2)缺少信息性样本。具有低于预定义阈值的预测置信度的忽略的未标记数据可以具有信息性数据(例如,聚类边界附近的样本,未标记分布空间中的代表性样本),这可以进一步提高模型基于上述观点,医学图像SSL的一个有意义的优化目标是探索一种有效的学习方法来深入挖掘未标记的医学数据受另一种利用未标记数据的替代方法的启发,即主动学习(AL)[38],其目的是选择信息量最大的样本,以最小的标记成本最大化模型性能。AL似乎是一个诱人的方法来处理上述问题的伪标记SSL方法。如图1所示,SSL已经通过伪标记产生了来自具有高置信度的所选未标记数据的知识的实施例。明智的AL选择可以反映在这种具体知识之上的附加信息样本的价值这些信息案例可以帮助SSL模型将额外有价值的知识传播给未标记的数据,从而提高未标记数据的利用率,以实现更好的SSL。事实上,AL和SSL在其共同目标方面自然相关,即,利用未标记的样本。从机器学习的角度来看,利用相关学习方法之间的相关性和相似性可以被视为一种诱导迁移。它可以引入归纳偏差[3],使组合学习方法更倾向于正确的假设,从而提高性能。总体而言,我们提出了一个新的框架BoostMIS,旨在提高医学图像SSL,它包括以下几个部分:(1)医学图像任务模型。任务模型(本文中的医学图像分类)首先通过具有监督标签的弱增强医学图像进行训练。(2)基于一致性的自适应标签分解器。该模块使用伪标记和一致性正则化来传播未标记数据的标签信息。由于学习能力和性能-由于模型在每个训练阶段的性能是不同的,我们根据当前的学习状态定义了一个动态自适应的阈值来产生伪标签,以更好地利用未标记的数据。然后,一致性正则化迫使模型产生与正则化准则相同的弱增广和强增广数据的(3)对抗性不稳定性为了通过AL提高SSL,我们引入虚拟对抗扰动来选择位于聚类边界上的不稳定样本作为注释候选。具体地说,SSL模型在簇的边界上可能较弱甚至不一致(4)平衡不确定性。为了进一步识别未标记池中的信息案例,我们使用SSL模型的密度感知熵来均匀地选择每个预测类中具有高不确定性的样本作为互补集,以平衡后续的训练。对抗性不稳定样本和平衡不确定性样本的联合将是扩展标记池的最终注释候选者。综上所述,我们提出的四个模块在一个循环中工作,共同进步,以提高医学图像SSL。概括起来,本文的主要贡献如下:• 据我们所知,我们是第一个将AL纳入SSL的公司,以释放未标记数据的潜力,从而更好地进行医学图像分析。• 我们提出了自适应伪标记和信息主动标注,合理地利用未标记的医学图像,并形成一个闭环结构,以提高医学图像SSL。• 我们收集了转移性硬膜外脊髓压迫(MESCC)数据 集, 用于 方 法开 发和 广 泛评 价, 旨 在优 化MESCC诊断和分类,以改善专科医生转诊和治疗。• 所 提 出 的 BoostMIS 的 一 致 的 优 越 性 , 证 明 了MESCC数据集上的现有SSL方法的大幅度超越。2. 相关工作半监督学习。半监督学习(SSL)涉及从未标记和标记样本中学习,其中典型的方法包括熵最小化[16,21,47],伪标记(也称为自训练)[1,11,25,51]和一致性正则化。[2,10,45,50],以提高模型 再-120668··U·UU·≤C·XX·UPNli=1X → YX{|}ii=1Y{|}X YUUXY···|·u参与者S((C|U );(θS,θA))中心工作FixMatch [42]提出同时结合伪标记和一致性正则化,在半监督任务中表现出有希望的性能。FixMatch [42]通过将这些技术与弱和强数据增强相结合来实现SoTA结果,并使用交叉熵损失作为正则化标准。然而,FixMatch存在数据利用率低的问题,即它忽略了大量置信度低于标记阈值的未标记数据。因此,医学图像SSL的一个重要目标是适当地利用未标记的数据。医学图像分析中的半监督学习。由于数据标注的困难,SSL被广泛用于医学成像处理,例如,医学图像检测[48,60]、分类[18,34,39]和分割[36,61]。[48]提出了一种用于3D医学图像检测的SSL方法,该方法使用焦点损失的一般概括来正则化SSL训练。[61]通过SSL提高了疾病分级和病变分割的性能[36]使用基于注意力的SSL学习方法来提高医学图像分割的性能。然而,这些先前的工作仅限于SSL,这可能无法深入挖掘未标记数据的潜力。半监督主动学习。最近,很少有人提出将SSL和AL相结合的工作。[12,41]通常采用SSL方式的VAE-GAN结构,通过最小-最大博弈来学习最新的作品[15,17,43]基于给定一组数据扩充的预测不一致性进行组合。然而,所有这些方法都是针对自然图像分类任务而设计的,而本文的重点是复杂的医学图像SSL任务。3. 方法本节描述了所提出的医学图像半监督(SSL)框架BoostMIS。我们将描述每个模块并介绍培训策略。T(; θ)是具有SSL的任务模型(本文中的医学图像分类),S(;θ)是通过主动学习(AL)进行的标注候选选择。在SSL方面,T(;θ)在医学图像任务模型中用弱增强的标记样本训练,在基于一致性的自适应标记分类器中将标记信息传播给未标记样本。选择后验概率高于自适应阈值的未标记样本作为具有伪标签s的训练样本s,其与增强感知一致性正则化相结合来训练T(; θ)。在AL方面,一旦SSL训练过程完成,我们将具有扰动的样本u馈送到T(; θ)以生成对抗不稳定性训练中的对抗样本。 然后,我们选择出前K个样本,其中前K个样本与其对抗样本之间的KL-分歧最大。为了进一步识别未标记池中的信息案例,我们使用T(;θ)的熵来均匀地选择每个预测类中具有高不确定性的前K个样本作为互补集,以平衡后续的训练。 由重新选择的N个A样本(由于候选者的交叉而为2K)组成的最终候选者被提供给人类专家用于注释。因此,将更新标记池和未标记池的大小以执行更好的SSL。这个循环将一直重复,直到任务模型3.2.医学图像任务模型对于任务模型开发,我们训练了一个卷积原型网络[53],其中Resnet50 [20]作为其骨干。给定标记数据=xiNl,具有弱增广(例如,仅使用翻转和移位数据扩充)和它们对应的标记=yN1,N1是标记的样本的数量。任务模型通过映射函数F:训练,交叉熵损失通过监督标签信息最小化。1Σ3.1.问题公式化在介绍我们的方法之前,我们首先介绍一些θs(θS)=Nli=1D ce(yi,P m(pi|A w(xi)(2)基本概念和术语。我们考虑一个带有相应标签的训练样本池和未标记的训练样本池。目标是使用所有配对样本(,)和未标记样本 训练提出的医学图像SSL框架BoostMIS。如图2所示,我们使用以下训练管道M(. ;θ)来展示BoostMIS是如何工作的:M((X,Y,U);(θS,θA))= T((Y,Ps))|(X,U s)); θ S)其中Pm()表示任务模型的后验概率Dce(,)表示两个概率分布之间的交叉熵。pi是预测的标签。A w(. )是弱增广函数。3.3. 基于一致性的自适应标签传播器受FixMatch [42]的启发,BoostMIS中的SSL标签传播器是两种方法的组合:伪标签和一致性正则化。伪标签“Boostx`SSL测试验证`ALAnn旋转xx(1)基于任务模型的预测,当其置信度高于定义的阈值时,计算未标记的弱增强图像的12066900000MaxΣUi=1U{|}uCountt−12K我|u}图2. BoostMIS概述。它由四个模块组成:(a)医学图像任务模型通过有监督学习,用弱增广标记数据训练基本任务模型。(b)基于一致性的自适应标签分解器通过动态调整阈值的伪标签和基于增强的一致性正则化将标签信息传播到未标记的样本。(c)对抗性不稳定性分析通过扰动来估计非稳定性数据及其对应的虚拟对抗性示例的KL-发散度,以选择注释候选。(d)BalancedUncertainty Selector均匀地选择不确定性高的样本作为补充注释集,以平衡后续的SSL训练。针对强增强图像的任务模型的输出强制执行然而,在每个训练步骤中,模型的学习能力和性能是不同的因此,我们引入了自适应阈值(AS),它可以在不同的学习状态下动态调整,以更好地利用未标记的数据。从形式上讲,在每个迭代训练步骤t中,具有较少样本的类的AS_t定义如下:α·最小值{1,计数 }+β·NA, 如果t Tα+β,否则其中系数α和β是预定义的阈值。Nu计数t=1(P m(pi|A w(ui))> α + β)(4)i=1Count_t记录预测得分高于高置信度阈值α + β的未标记数据的数量。 我们认为,SSL模型的学习效果可以反映的预测是在阈值以上的样本的数量。 可以基于当前学习状态和AL信息选择的量来动态地调整AS阈值,以鼓励更好地利用未标记数据(预测具有较少样本的类),直到迭代步骤超过Tmax。因此,我们用弱aug来喂养未标记的数据集UT是迭代学习步长的定义值N任务模型中。 选择的预测Max将样本Us={usN s}转换为独热伪日期. 伯爵是一个计数函数,用于估计学习-标签Ps ={ps|Nsi=1u}当它们的预测置信度为不在时间步长t处的状态。 给定 = uiNu(N u是未标记数据的数量),Count_t计算如下:i i=1高于自适应阈值,其中Ns表示SSL选择的未标记样本的BER。 然后介绍标记数据培训医学图像任务模型监督培训顾问(顾问)���弱增强权重共享预测基于一致性的自适应标签传播器数据池推理自适应000阈值未选择伪标记传奇无标签数据类零类一不确定样本不稳定样本中文(简体)��� 监督损失ℓ () 无监督损失rp(π) 扰动弱增强权重共享选择的预测培训未选择的数据删除无标签数据库强增强一致性正则化���������算法预测SSLAL平衡不确定性选择器平衡-K搜索原始预测{ }熵…推理…熵计算人类专家预测弱增强对抗性不稳定性选择器Top-K搜索(刘伟)扰动预测注释候选项{ }…=联系我们……KL-分歧…KL-发散度预测扰动表示rp(单位:厘t=(三)是主动学习选择的注释candi的数量。.一120670∇我··我}我我我我··我····Nc⌊⌋我|我ui=1u第未标记样本uu的熵Ent′(·;·)我我我我我u我我 S我 SM我 J我我 我我 我Σ我我我Nu我M增强感知的一致性正则化,它计算模型该模型被训练以在强增强图像上执行其预测,以匹配可以利用神经网络的反向传播的一次迭代来执行对BtprDiv的计算一旦rp被求解,我们就可以通过测量KL散度来估计未标记样本ru的方差V ar(;)伪标签通过交叉熵损失。V ar(ru;θ)=Div(P(pu|ru),P(p'u|ru+rp))(8)iAm我我我我Nsu(θS)=µuSui=1 D ce(P m(ps|A w(us)),P m(ps|(美国))(5)最后,AUS从不稳定样本中选取变异最大的前K个样本作为AL的初始召回集其中μ是一个固定的标量超参数,表示未标记损失的相对权重A s(. )表示强增强函数RandAugment [9]。3.4. 对抗性不稳定性选择器上述SSL模型的标签传播器可以将标签信息从标记数据传递到伪标记样本。然而,在未入选的样本中,也有许多有参考价值的案例这些样本无法获得足够的标签信息,任务模型对这些样本的局部数据分布有一个模糊 从这个意义上说,选择有信息的样本进行进一步标注更有价值,这可以帮助SSL模型平滑决策边界,并将代表性的标签信息传播到未标记的数据。我们将样本U u={uu(N u是样本的数量,注释候选项。这些不稳定的样本通常位于聚类的边界上3.5. 平衡不确定性选择器除了不稳定的样本,还有大量的不确定的样本,仍然保持低预测的信心,任务模型也提供信息。为了进一步寻找不确定性样本来增强SSL模型,我们引入了平衡不确定性选择器(BUS),它在每个预测类中均匀地选择不确定性高的样本。这些选定的样本可以显著降低模型的不确定性并平衡子样本的SSL。在实践中,我们使用任务模型的熵来估计样本的不确定性,然后均匀地选择具有最大熵的前K个样本)分为两类:不稳定和非-一定。在本节中,我们的目标是通过引入对抗不稳定选择器(AUS)来找到不稳定AUS估计模型预测的稳定性用以下公式计算:En t′(uu;θS)=φPm(pc|Aw(uu))lo gPm(pc|Aw(uu))(9)c∈C通过计算样本之间的不一致性对样本和相应的虚拟对手样本的预测具体地说,给定一个n个样本uu(i≤N u),它的表示ru是从上一个样本中提取出来的。其中C是数据集中可能的类的集合。 pcin-表示属于第c类的预测类uu。上述基于熵的公式仅估计了每个样本的信息确定性,而没有考虑分布。任务建模和预测层是pu。 我们考虑了样本之间的比例关系。因此,在本发明中,我我pu同时进入生成器以获得虚拟adversar- 度量可能会遇到选择一些离群值的风险Ip微扰 在那之后,扰动表示<$ru=ru+rp被输入到任务模型中,或分布空间中的非代表性样本为了解决这个问题,我们重新加权不确定性度量,prediction预测扰动被表示为:一个代表性的S因子,并解释考虑数据rp= arg maxDiv(P(pu|ru),P(p'u|ru+r))(6)分布我们将这种密度感知的不确定性表示为:我 ∆r,||阿德尔||≤τM我我M我我Ent(uu;θ)=Ent′(uu;θ)(1<$Sim(uu,uu))(10)扰动步骤,其中,Dir是随机采样向量,Div(,)是一个衡量两个分布之间分歧的非负函数,我们在实践中使用KL分歧。rp的计算不能用方程进行。(6)因为Div(,)相对于r的梯度在r= 0时总是0。为了解决这一问题,[35]提出了约-使用二阶泰勒展开式模拟rp,并求解其中Sim(,)估计分布空间中ru及其最近的M个样本 每个类采样K个图像作为不确定的注释候选者。最后,不稳定和不确定的样本的联合组成最终的注释候选者,以扩大标记池,这带来了信息丰富的情况下,以改善后续的SSL。我RPi通过幂迭代法。具体可以通过重复应用以下更新来近似rpnt次(nt是一个超参数):N其中,τ是指示每个最大值的超参数,j=1120671rp←τrDi v(Pm(pu|ru),Pm(p<$u|ru+r))(7)4. 实验我们评估了我们提出的BoostMIS在两个数据集的有效性,这两个数据集是转移性硬膜外脊髓120672≥∼∼压缩(MESCC)数据集,然后讨论BoostMIS4.1. 数据集和设置数 据 集 。 我 们 收 集 了 转 移 性 硬 膜 外 脊 髓 压 迫(MESCC)数据集,旨在帮助MESCC诊断和分类。它包括从成人患者(18岁)中收集的7,295张医学图像,随机选择不同MRI扫描仪(GE和Siemens 1.5和3.0T平台)的在绘制每个边界框时,注释放射科医生采用Bil- sky分类[5],该分类由6种等级的患者组成一般来说,我们也可以将这些等级分为低级(即,b0,b1a和 b1b ) 和 高 等 级 ( 即 , b1c、 b2 和 b3 ) BilskyMESCC。具体而言,低级别患者适合放疗,而高级别患 者更 可 能需 要手 术 减压 。 数据 集 随机 分为 70%(5207)/15%(1011)/15%(1077)的训练/验证/测试集。有关MESCC数据集的更多详细信息,请参见附录。实施详情。我们采用Wide ResNet- 50 [20]作为骨干模型来执行医学图像分类任务。为了用平衡的初始化训练基于AL的SSL模型,我们通过在每个类中均匀采样来设置初始标记池(10%数据)。初始标记池是纯SSL模型的训练集(30%数据)的子集,其他数据是随机采样的。我们用标准随机数训练BoostMIS-tic梯度下降(SGD)[6]优化在所有的实验。此外,我们使用一组相同的超参数(μ=1,Mo=0.9,α=0.9,β=0.05,Tmax= 50,000,τ=1,B=64,所有数据集的AC=30,IP= 10%,SS=30%)2指标. 为了评估医学图像分类任务,我们采用了以下指标:准确度(ACC),宏观精度(MP),宏观F1评分( MF1 ) [8] , 宏 观 召 回 率 ( MRC ) [8] 和 错 误 率(ER)。方法比较。 为了量化疗效在建议的架构中,我们根据不同的方面使用多个基线进行性能比较。在SSL方面 , 我 们 考 虑 三 个 SSL 基 线 : P- Labeling[25] ,MixMatch[4],FixMatch[42]。在AL方面,我们选择以下最新方法作为基线:R-标记[13],DBAL[14],VAAL[41]和CSAL[15]。关于基线的更多细节见附录。此外,我们还通过评估以下变体来研究BoostMIS中每个单独组件的有效性:(1)BoostMIS(-AS)使用固定的置信阈值(α+β)将标签信息传播到未标记数据。(2)BoostMIS(-BUS)只考虑Incon-2B和Mo是指SGD优化器中的批量大小和动量。IP=10%和SS=30%是初始AL标记池和SSL训练集的采样率。AC表示最大AL训练周期。在AL标注中选择合适的医学图像。(3)BoostMIS(-VAR)选择没有对抗性不稳定性的AL注释候选。(4)SSL+RS是BoostMIS的简化版本,它由BoostMIS中的SSL模型构成,采用随机抽样策略。4.2. 实验结果表1列出了我们的框架和MESCC数据集测试集基线的总体定量结果。从该表中,我们可以观察到,我们的模型在15%到30%的标记数据中始终实现了性能优势。特别是在30%的标记数据下,BoostMIS在MESCC医学图像分类任务的准确率方面优于其他基线,分别为2.88%10.21%(两级)和2.70%18.31%(六级)。值得注意的是,几乎所有基于AL的SSL模型都可以通过采用适当的注释策略来提高模型性能,除了R标记。这种现象是合理的,因为随机选择的注释候选者对于SSL模型来说信息不足。此外,与纯SSL模型Fixmatch 相 比 , BoostMIS 在 达 到 类 似 性 能(BoostMIS:91.46%,Fix-match:91.09%)的同时,注释成本(500个样本)大幅降低了10%也就是说,BoostMIS利用了 显著的性能改进。我们还在表2中报告了比较模型的宏观精度、宏观F1分数和宏观召回率。我们的BoostMIS再次在所有指标中获得最佳分数。值得注意的是,与表1中的全局准确度相比,基于AL的SSL模型的结果未能保持一致的优越性。例如,基于AL的SSL基线的宏调用分数劣于Fix-Match。这是因为这些AL模型倾向于选择具有b 0/低等级的注释候选者,其在MESCC数据集中具有最大的数据比例。没有均衡监督标签信息的不均衡注释候选可能导致其他类数据的错误分类。同时,BoostMIS中的平衡不确定性选择器在每个预测类中统一选择不确定性高的样本,这有助于保持一致的显著结果。4.3. 深入分析我们进一步验证了所提出的方法的几个重要问题,回答了以下四个问题。问题1:BoostMIS中的各个组件对提高医学图像SSL的贡献是什么?我们进行了一项消融研究,以说明有效性120673方法AL-1MESCC两级15%标签20%标签25%标签30%标签MESCC六级20%标签25%标签30%标签表1. MESCC数据集上的性能比较。上标†表示模型仅采用SSL算法。AL注解表示SSL模型(FixMatch)使用相应的AL注解策略。我们报告了当标记池的百分比达到15%/20%/25%/30%时,所有这些模型的准确性。分数越大表示性能越好,准确性是大胆的。每个型号的首字母缩写符号可参见第4.1节。[25]第二十五话MixMatch[4][42]第四十二话78.64± 5.2085.42± 2.6985.52± 2.0481.34± 4.6486.44± 2.8887.37± 3.0682.54± 5.8588.77± 1.3990.34± 1.4985.61± 4.7490.81± 1.5891.09± 0.3032.43± 5.3943.18± 4.1841.41± 4.2737.88± 3.5346.98± 1.6748.65± 1.7643.16± 3.8152.83± 0.9354.32± 1.02R-标签[13]DBAL[14]VAAL[41]CSAL[15]✓✓✓✓83.66± 5.2986.72± 4.0986.07± 3.9088.39±2.5184.12± 5.9188.67± 3.0688.95±2.8888.49± 2.6087.47± 3.3489.04± 1.6790.71± 1.4991.27±1.4988.67± 3.5391.74± 0.3792.11± 1.2192.94±0.3738.07± 6.6945.13± 3.9046.89±2.6946.80± 4.6442.34± 5.7649.58± 1.7650.60± 0.8452.83±1.2150.88± 4.8354.87± 0.6557.85± 0.5658.77±0.62BoostMIS✓89.14±3.1691.46±1.4993.13±1.6795.82±0.2848.19±1.6757.38±1.5861.47±0.56表2.在MESCC数据集上的宏精确度(MP),宏F1评分(MF1),宏召回率(MRC)的实验结果。表3. BoostMIS中不同模块在MESCC上的消融研究。当AL选择样品达到20%的数据。MESCC六级MP MF1 MRC方法阈值AL选择ACC自适应固定不确定不稳定2 六SSL+RS✓91.45 53.76- 作为- 总线- AUS✓✓✓✓ ✓✓✓94.98 60.0794.06 60.4492.57 58.03BoostMIS✓✓ ✓95.82 61.47表3中的每个组件。比较BoostMIS和BoostMIS(-AT)(第2行与第4行),自适应阈值显著提高了0.84%和1.40%的准确度。行3和行4的结果分别示出了AL模块中的AUS(不稳定采样)和BUS(不确定采样)的精度提高。同时,结合BoostMIS中SSL模块和AL随机抽样的SSL+RS(Row1)算法性能最差。这进一步验证了我们的AL信息选择的优越性。最后,结果表明,引入的两个AL选择策略可以提高医学图像SSL在一个相互奖励的方式。Q2:如何确定初始标记池的最佳起始大小?我们进行探索性分析,系统地推断BoostMIS的初始标记池(IP)的适当起始大小。如图3所示,使用均匀采样来选择不同的起始大小,BoostMIS及其变体实现了不同的精度(最佳起始大小为10%数据)。例如,以IP=5%标记数据开始的模型明显低于以IP= 10%标记样本开始的模型,两种模型均达到30%的标记样本。我们观察到,一个SSL模型与一个小的开始大小的标记数据可能会盲目地预测一些未标记的样本到某个类,由于事实上,该模型缺乏这些样本的数据分布信息。这可能影响基于来自任务模型的预测的子任务选择。相反,大的起始大小也可能降低基于AL的SSL能力(例如,10%和15%标记样品)。虽然任务模型可以学习相对强的数据分布,但AL预算的容量是有限的。没有足够的AL选择数据来提高任务模型的鲁棒性。总之,天真地选择起始大小是不可取的,因为它可能导致基于AL的选择的利用不足。问题3:这些注释候选人从AL选择离子有价值的信息?为了建立对我们的AL选择方法的卓越性能的见解,我们对从信息丰富的注释候选者中受益的准确性改进进行了深入分析。图4总结了在监督学习中使用不同标记样本的任务模型方法MESCC两级MP MF1 MRC[25]第二十五话61.1562.7365.4623.1322.6832.20MixMatch[4]73.1577.2084.5028.3329.2838.81[42]第四十二话73.7577.9785.6030.1131.7040.24R-标签[13]65.8666.6867.6427.5827.9134.34DBAL[14]76.9778.8981.2428.1328.5433.61VAAL[41]75.6078.9183.7931.7633.3839.75CSAL[15]77.8778.8779.9732.5534.0739.83BoostMIS86.0987.5489.1536.7438.7745.06120674错误率(%)(a) 两级精度9796959493929190895% 10% 15%20%初始比率标记数据(b) 六级精度626160595857565554535% 10% 15% 20%初始比率标记数据102928272625242(a) 测量的准确度和误差率1412108640.50.. 550.60.650.70.750.80.850.9 0.91系数102928272625242(b) 测量的准确度和误差率1412108640.010.020.030.040.05零点零六系数BoostM IS-AS-BUS-AVUASRSSL+R S两级ACC六级ACC两级ER六级ER图3. 不同初始标记数据池IP大小下的性能比较。图5. 不同系数的自适应阈值(AS)的α和β10080604020(a) 准确度比较(b)平均精密度比较10080604020(a) 二级可视化(b)六级可视化020%铝20%随机20% SSL100%标签020%铝20%随机20% SSL100%标签标签标签标签标签标签标签图6. MESCC数据集的tSNE嵌入和BoostMIS的AL选择行为。图4. 监督学习在MESCC数据集上使用不同的标记数据设置。监督的标签。这证明了原始数据是无偏的,并没有妨碍模型其次,用人工智能选择的样本训练任务模型可以更好地代表全局数据分布。20%AL样本的准确性结果即使与100%标记数据的训练模型相比也具有竞争力。为了进一步分析改进来自何处,我们通过图6中的tSNE嵌入[ 44 ]可视化了我们方法可视化结果表明,AUS倾向于选择决策边界附近的不稳定样本,而BUS可以选择代表性的不确定样本。这些不稳定样本和不确定样本分别可以平滑医学图像SSL模型的决策边界和向未标记数据传播代表性标记信息Q4:模型可以信任基于自适应阈值的伪标签吗?我们研究了AS的超参数α和β对SSL能力的影响。MESCC数据集上不同超参数的分类错误率和准确度如图5所示。我们可以观察到,生成的伪标签的最低错误率为4.83%和8.26%的两个分级和六个分级。该图还表明,α和β的最佳选择约为0.9和0.05,增加或减少这些值都会导致性能下降。5. 结论在本文中,我们提出了一个医学图像半监督学习(SSL)框架BoostMIS,它利用主动学习(AL)来释放未标记数据的潜力,以更好地进行医学图像分析。在该算法中,我们提出了自适应伪标记和信息化的主动注释,利用未标记的医学图像,并形成一个闭环结构,以提高的性能的医学图像SSL模型。实验结果表明,BoostMIS显着优于SoTA SSL和AL方法的医学图像分类任务。提议的框架利用Apache SINGA [37]进行分布式培训,已集成到我们的MLCask [33]中,用于处理医疗保健图像和分析。致谢我们要感谢匿名评论者的有益建议和评论。本研究由新加坡教育部学术研究基金Tier 3(MoE官方资助编号MOE 2017-T3-1-007)、新加坡卫生部国家医学研究委员会(NMRC临床医生-科学家个人研究资助编号CNIG 20 nov-0011和MOH-000725)、NCIS人工智能中心资助种子资金项目(用于脊椎转移瘤的管理)支持95.5861.4797.8687.0983.56 83.7564.8136.5833.4333.6194.767.563.7462.748.9628.0225.2424.98标签设置两级标记设置六级95.588.2661.474.8295.588.2661.474.82准确度(%)准确度(%)准确度(%)准确度(%)平均精密度(%)误差率(%)准确度(%)120675引用机器学习会议,第1183-1192页。PMLR,[1]Eric Arazo,Diego Ortego,Paul Albert,Noel E O'Connor和Kevin McGuinness。伪标记和确认2017. 六、七[15]高明飞, 张子昭 郭玉,塞尔坎奥阿里克,深度半监督学习中的偏差2020年国际神经网络联合会议(IJCNN),第1IEEE,2020年。2[2] Philip Bachman,Ouais Alsharif,and Doina Precup.学习伪合奏。神经信息处理系统,27:3365-3373,2014。2[3] 乔纳森·巴克斯特。归纳偏差学习模型人工智能研究杂志,12:149-198,2000。2[4] David Berthelot 、 Nicholas Carlini 、 Ian Goodfellow 、Nicolas Papernot 、 Avital Oliver 和 Colin Raffel 。Mixmatch:半监督学习的整体方法arXiv预印本arXiv:1905.02249,2019。一、六、七[5] Mark H Bilsky,Ilya Laufer,Daryl R Fourney,MichaelGroff , Meic H Schmidt , Peter Paul Varga , Frank DVrionis , Yoshiya Yamada , Peter C Gerszten , andTimothy R Kuklo.硬膜外脊髓压迫评分的信度分析神经外科杂志:脊柱,13(3):324-328,2010。6[6] 我 在 博 图 。 随 机 梯 度 下 降 的 大 规 模 机 器 学 习 在COMPSTAT’2010的Proceedings施普林格,2010年。6[7] Jieneng Chen,Yongyi Lu,Qihang Yu,Xiangde Luo,Ehsan Adeli,Yan Wang,Le Lu,Alan L Yuille,andYuyin Zhou. Transunet:Transformers为医学图像分割提供了强大的编码器。arXiv预印本arXiv:2102.04306,2021。1[8] 南希·钦乔和贝丝·M·桑德海姆。Muc-5评价指标。在第五次信息理解会议(MUC- 5):在巴尔的摩举行的会议记录,玛丽兰,1993年8月25日至27日,1993年。6[9] Ekin D Cubuk,Barret Zoph,Jonathon Shlens,and QuocV Le. Randaugment:实用的自动数据扩充,减少搜索空间。在IEEE/CVF计算机视觉和模式识别研讨会会议记录中,第702-703页,2020年。5[10] Zihang Dai , Zhilin Yang , Fan Yang , William WCohen,and Ruslan Salakhutdinov.好的半监督学习需要一 个 坏 的 团 队 。 arXiv 预 印 本 arXiv : 1705.09783 ,2017。2[11] Guodong Ding , Shanshan Zhang , Salman Khan ,Zhenmin Tang,Jian Zhang,and ZhaohPorikli.基于特征亲 和 度 的 伪 标 记 用 于 半 监 督 身 份 再 识 别 。 IEEETransactions on Multimedia,21(11):28912[12] Sayna Ebrahimi,Mohamed Elhoseiny,Trevor Darrell,Marcus Rohrbach. 贝叶斯神经网络不确定性引导的连续学习。arXiv预印本arXiv:1906.02425,2019。3[13] Rosa L Figueroa , Qing Zeng-Treitler , Long H Ngo ,Sergey Goryachev,and Eduardo P Wiechmann.临床文本分类的主动学习:它比随机抽样更好吗Journal of theAmerican Medical Informatics Association, 19(5 ):809-816,2012. 六、七[14] Yarin Gal、Riashat
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Aspose资源包:转PDF无水印学习工具
- Go语言控制台输入输出操作教程
- 红外遥控报警器原理及应用详解下载
- 控制卷筒纸侧面位置的先进装置技术解析
- 易语言加解密例程源码详解与实践
- SpringMVC客户管理系统:Hibernate与Bootstrap集成实践
- 深入理解JavaScript Set与WeakSet的使用
- 深入解析接收存储及发送装置的广播技术方法
- zyString模块1.0源码公开-易语言编程利器
- Android记分板UI设计:SimpleScoreboard的简洁与高效
- 量子网格列设置存储组件:开源解决方案
- 全面技术源码合集:CcVita Php Check v1.1
- 中军创易语言抢购软件:付款功能解析
- Python手动实现图像滤波教程
- MATLAB源代码实现基于DFT的量子传输分析
- 开源程序Hukoch.exe:简化食谱管理与导入功能
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功