不确定数据学习的挑战及应对方法

175 浏览量更新于2023-10-16 收藏 1016KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

10590医学图像诊断吴伯通1，孙新伟2，胡玲静3，5，王一舟1，4，51计算机科学系，北京大学2微软亚洲3首都医科大学4Deepwise AI Lab5鹏程实验室{botongwu，yizhou.wang}@ pku.edu.cn，Xinwei. microsoft.com，hulj@ccmu.edu.cn摘要在基于图像的疾病预测中，由于缺乏足够的信息，在其早期阶段。我们称这种情况为“不确定”数据。将这些数据标记为不确定，表明进行后续检查，以避免不可逆转的医疗事故/损失，而不是不谨慎的预测。这是临床诊断中的常见做法，然而，大多被现有方法所忽视。用不确定的数据学习还与另外两个实际问题交织在一起：(i) 数据不平衡问题，其可能导致模型偏向多数类，以及（ii）保守/积极策略考虑，即，阴性（正常）样品和阳性（疾病）样品不应该被同等对待--前者应该以高精确度（保守性）检测，而后者应该以高回忆度（侵略性）检测，以避免错过治疗机会。加上这些问题，学习不确定的数据变得特别具有挑战性。在本文中，我们提出了“不确定数据的学习”问题，并将其表述为有序回归，并提出了一个统一的端到端学习框架，该框架也考虑了上述两个问题：（i）引入代价敏感参数以缓解数据不平衡问题，（ii）通过在训练过程中引入两个参数来执行保守和积极策略。在预测阿尔茨海默病和肺结节上证明了不确定数据学习的好处和我们模型的灵活性1. 介绍医学图像分析中的疾病早期预测通常假设可以对每个样本给出确定性的“疾病/正常”标签。然而，可能有许多情况违反了这一假设，因为它们在早期阶段没有表现出明显的证据来确定。例如，许多阿尔茨海默病（AD）患者放射科医师评级g（ −1）h（γ1）g（γ1）h（γ−1）恶性不确定良性预测得分图1.说明我们这项工作的主要思想。红色、蓝色和绿色点表示阳性、不确定和阴性的数据点。两条虚线之间的区域中的点被预测为不确定的。如图所示，由黑色标记的阈值偏向多数（不确定）类。这种效果可以是用g（±1）表示。此外，传统的分类与医学影像诊断的任务之间存在差距，其中良性分类应谨慎预测，而恶性分类应高回忆率预测这样的间隙可以用h（γ±1）来测量。然后，我们引入成本敏感参数γ±1和γ±1，以减轻不平衡的问题，并在学习过程中分别结合保守/积极的策略。曾经历介于正常对照（NC）和AD之间的称为轻度认知损害（MCI）的中间阶段。然而，MCI不一定会转化为AD。MCI进展的预测在早期阶段是非常困难的，因为这些样本的MRI/PET没有显示病变区域的许多变化（例如，两侧的校园）。这些数据的准确预测需要后续的检验，如图1所示2，它不能被确定为阳性，直到24个月后转化为AD。相反，对这些病例的早期不谨慎的预测在本文中，我们称这些情况为10591表1.在ADNI数据集上使用带有二进制标签的DenseNet比较不确定数据和确定数据sc m12M24数据拆分数据数量ACCFPR可靠数据2483.3313.33不确定数据/MCI5161.0937.04大多数现有的方法[16，14，4]只是简单地排除了希波卡海马体积（mL）6. 6567预测得分（λ 1 = 1. 2122）0.56566.47871.94336.29972.1898因此，在模型训练期间，这些不确定的数据容易导致对这部分数据的错误预测。为了看到这一点，我们在ADNI数据集1上进行了一个实验，其中MCI类被视为不确定类。我们训练了一个二元分类器（3D如表1所示，不确定数据（MCIc/MCIs）的准确性和假阳性率（FPR）比确定数据（AD/NC）差得多换句话说，不确定的数据很难被正确预测。在机器学习文献中，有一个看起来很相似，但完全不同的概念，称为“硬样本”。硬样本来自噪声标签或由于模型容量的限制人们试图通过主动学习[29]或提升方法[8]来准确预测它们然而，不确定数据是由其性质定义的，例如，在疾病的早期阶段。因此，由于缺乏信息，很难给出一个决定性的标签。这种类型的数据可以占用数据集的很大一部分用于模型训练。我们认为，它是负责任的和合理的，以确定这种不确定的数据，而不是分配一个二进制标签，每个数据项没有保证。将病例标记为不确定实际上意味着该病例需要进行随访检查。与传统的假设类间独立的多类问题相比，因此，传统的交叉熵（CE）损失，这是sume类之间的独立性，可能无法模拟这样的关系。（ii）数据不平衡问题：由于不确定数据可能是多数类别，这可能导致模型偏向不确定类别，如图1中的g（n±1）所示。（iii）诊断策略问题：阴性和阳性样品在临床实践中通常被不同地处理，如图1中的h（γ±1）所示。例如，对恶性病例的召回比对良性病例的召回更重视是合理的因此，在诊断过程中考虑这种策略是很重要的在本文中，我们提出了“不确定数据的学习”问题，并将其表述为有序回归问题，并提出了一个端到端的学习框架来建模不确定数据。在这个框架中，引入了三组参数来解决上述三个实际问题。1http://www.loni.ucla.edu/ADNI图2.随访（筛选（sc）、12个月和24个月）MCI病例的图示，其中玻璃脑中的海马和海马体积映射（HVM）的3D切片视图HVM的体积线性映射到颜色：颜色越深，海马萎缩越严重。并给出了模型预测的海马体积和评分。阈值参数、代价敏感参数（k）和策略参数（γ）。具体来说，我们扩展的概率模型的二进制标签的分类问题，与不确定的数据，通过将阈值参数。为了缓解数据不平衡问题，我们通过引入成本敏感参数进一步采用成本敏感损失[17]在训练过程中，这些参数可以被优化以拟合来自大多数类的数据，并且因此可以导致具有较小阈值参数值的不频繁类（正和负）的更多预测。此外，与文献[17]不同的是，该方法可以通过随机梯度下降自动学习代价敏感参数（以及阈值参数和骨干神经网络参数）。此外，为了执行保守和积极（C/A）策略，我们还引入了策略参数来调整预测的边际（阈值）参数。我们将我们的模型应用于阿尔茨海默对于AD，MCI被认为是不确定的数据，并且发展到AD/转换的预测需要随访检查。对于LNP，我们遵循之前关于肺部图像数据库控制器（LIDC）[22]的工作[4，26，15]中的标准来标记恶性和良性;被现有模型丢弃的其他数据被视为不确定数据。结果表明，我们的方法优于其他方法，特别是交叉熵损失。此外，通过考虑数据不平衡性，可以进一步提高宏F1此外，我们表明，不同的策略可以导致不同的结果，在正面和负面类的精度/召回。特别地，通过实施C-A策略，所有阳性样本被检测为阳性（在大多数情况下）或不确定。这一结果与临床预期一致，即阴性者不应错过早期治疗的机会。此外，我们还发现，不确定数据的学习提高了确定数据的预测精度。HVM的3D视图VISCODEHVM的玻璃脑切片视图中的mpus1059212W1+exp（x）图3.我们的不确定数据模型的架构说明。DenseNet的一个变体被用作主干。作为成本敏感参数的Δ-1，1表示从黑色阈值到绿色阈值的橙色裕度g（Δ-1，1）。作为策略参数的γ-1，1表示从绿色阈值到红色阈值的蓝色裕度h（γ-1，1）。2. 相关作品2.1. 不确定数据建模考虑不确定数据的最相关文献是[28]，它考虑了部分排序问题。然而，与考虑成对数据的部分排序不同，医学分析中的此外，据我们所知，文献中还没有在医学分析中探讨过不确定数据问题。请注意，不能将其与硬样本混淆，硬样本具有地面真实标签，但很容易被错误分类。相应地，提出了许多工作来对这些样本进行分类，例如主动学习[24，29]和带噪声标签的预测[5]。2.2. 有序回归/分类2.3. 不平衡数据问题缓解不平衡问题[11]的典型方法是对次要类别进行过采样[6]或对主要类别进行欠采样[21]。由于欠采样会丢失信息，[7，30]提出了一种基于成本敏感损失定量设置小类权重的方法。然而，成本矩阵应预先设定。[17]修改了交叉熵损失中的成本矩阵，并能够优化以迭代地学习它。然而，成本矩阵中参数的学习依赖于验证集。在本文中，我们修改了它，使其适用于有序回归损失，可以学习它，而不使用验证集。3. 方法我们的数据由N个样本{xi，y i}N组成，其中xi∈X收集第i个样本（例如，成像数据），并且标记yi∈ Y={−1，0，1}，其中−1，0，1分别表示阴性、不确定和阳性状态。为了简单起见，我们将X和y分别表示为{xi}N和{yi}N的1 1一些作品[9，25]简单地将我们的任务视为一个常见的多类问题，而不考虑类之间的顺序关系，并应用交叉熵（CE）损失或均值方差损失。此外，[23]将有序回归转换为一系列二元分类子问题，以模拟每个子问题的分布。然而，他们忽略了消极类、不确定类和积极类之间的顺序关系其他的工作把它们看作是有序回归问题，包括[19，10，20]。详细地说，[19]包装了一个前导矩阵分解CF方法来预测每个类的概率分布。[10]提出了一个带有惩罚和非惩罚参数的概率模型。[20]通过对一系列条件概率进行建模来生成每个类别的概率。[3]使用Pois-son和二项分布对每个类进行建模。f w：X →R是判别函数（例如，神经网络输出），其取决于参数w。3.1. 二元数据预测模型对于二元分类问题，响应变量y i（i = 1，.，N）通常被认为是由以下各项生成的：®i1fw（xi）+ εi> 0y=−1f（xi）+εi0（1）其中ε1，…， εNi.i. dG（·）。不同的G导致不同的模型和相应的损失函数：（i）统一模型：G（x）=x+1（ii）概率模型：G（x）=Φ（x）（Φ是N（0，1）的离散函数）（iii）Logit模型：G（x）=sigmoid（x）=exp（x）。损失函数，也就是输入致密块状…Xig（−1）h（γ−1）γ−148ξ−1λ−1P−1（xi）P−1（xi）48h（γ1）g（1）48fw（xi）P（xi）−P（xi）1 −1…P1（xi）`（w，λ，λ，γ）损失1 −P1（xi）λ1ξ1γ1g（−1）h（γ−1）h（γ1）g（1）过渡层BN-ReLU-Conv3dBN-ReLU-Conv3dBN-ReLU-Conv3d………致密块1池化密集座2池化致密块3全球集中共用10593Pi1−11−11 1 11−1−1.P（y）的负对数似然|X）= N我iΣ验证集，这是不合理的，在医学成像（w）=−ΣNi=1 日志. .ΣΣGfw（xi）yi.i=1G fw（x）y，是设置;相比之下，我们可以直接实现随机梯度下降来优化搜索，这更简单，更容易。3.2. 不确定数据模型我们将我们的问题表示为有序回归问题[19]，因为疾病的严重程度从阴性类别（-1），不确定数据（0）到阳性类别（1）正在增加。我们通过引入（1）对不确定数据进行建模，将（1）扩展到包含不确定数据，阈值参数λ=λ（λ−1，λ1）（λ1> λ−1），效率高。我们解释了为什么这样的模型可以缓解数据不平衡的问题。请注意，数据库可以部分拟合数据，以抵消数据不平衡的影响。更详细地说，在医学分析中，不确定数据通常比确定数据更频繁。在这样的分布下，在（3）中直接优化λ（w，λ）可能会学习到大的阈值参数，因此可能导致模型在不确定数据中崩溃yi=1fw（xi）+εi> λ10λ−1≤fw（xi）+εi≤λ1（二）如实验结果中的交叉熵结果所示。如果我们设置log1>0和log−10，则学习的λ<−1fw（xi）+εi<λ−1倾向于更小。在预测阶段，我们采用与具有阈值参数（λ−1，λ1）的（5）相同的策略。我们将这种模型称为不确定数据模型（UDM），其中损失函数可以类似地导出为：λ越小，确定的数据（不频繁类）将越多鼓励成功分类。ΣN（w，λ）=−我[1{yi= 1}个日志..Σ1 −P1（xi）Σ注1注意，UDM与数据不平衡缓解一起也可以适用于多类分类问题。然而，我们的模型主要集中在+1{yi= 0}logP1（xi）− P−1（xi）对不确定的数据进行建模，这意味着很难哪里+1{yi.=−1} logΣ−1（x）]（3）明确给出一个标签。在这种情况下，将其归类为“不确定数据”是谨慎的P1（xi）= G（λ1−fw（xi））， P−1（xi）= G（λ−1−fw（xi））（四）在测试阶段，xi根据以下规则进行简单分类：3.4. 保守与进取战略在医学分析的疾病预测中，阴性类和阳性类在临床上常常被区别对待我pred1 fw（xi）>λ1= 0λ−1≤fw（xi）≤λ1−1fw（xi）<λ−1（五）cal诊断以避免疾病(such由于错过了治疗时机），对于大多数疾病，应在控制阴性样本假发现率的同时，充分检测阳性样本，这与积极和保守相3.3. 数据不平衡有些疾病是很难准确预测的，如肺结节、阿尔茨海默病等。因此，这类疾病通常具有在群体中占很大比例的不确定数据，这可能导致对不确定类别的优化偏差。为了缓解这样的问题，我们采用[ 17 ]中的思想，通过引入成本敏感的参数=（，）在培训过程中，（4）中的P±1（xi）修改为：战略，分别。为了模拟这种策略，我们提出引入参数γ=γ（γ，γ），其中（4）被修改为P（xi）= G. −f（xi）+λ+log+γ.ΣP−1（xi）= G−f（xi）+λ−1+logλ−1−γ−1，再次，由于在测试阶段期间仅包括 λ （即，（5）），γ1>0的实施可能导致λ1的值变小，从而可以更积极地预测正样本加上这样的强制执行，P1（xi）= G P−1（xi）= G.Σ−f（xi）+λ1+log1. −f（xi）+λ+log，然后将（3）中的函数修改为g（ w，λ，λ，γ）= λ（ w，λ，λ，γ）+注意我们的方法与[17]的不同之处在于：（1）[ 17 ]中的参数是样本依赖的，而我们的参数仅是类依赖的;y10594（2）[17]适用于CE损失，不适用于我们的情况;（3）[17]中的优化依赖于ρ1max（c1−γ1，0）+ρ−1max（c−1−γ−1，0）（6）其中c±1是预设的超参数。它们的符号对应于一个策略，即，10595i=1表2.在LIDC-IDRI数据集上比较我们的方法和基线F1，ma（在等式中所有β= 17）作为评价指标。损失F1，ma回忆-1召回0回忆1精度−1精密度0精密度1Poisson[3]62.5981.1937.2277.3452.8468.2163.87NSB[20]66.3424.3186.7574.2286.8959.2768.84MSE55.4593.4658.2512.0092.5955.0521.43CE65.6048.1774.4569.5361.0562.6078.07UDM69.3420.6489.9171.0988.2458.6472.22UDM+CS71.4726.1583.9179.6989.0659.6466.67表3.在ADNI数据集上比较我们的方法和基线。F1，ma（在等式中所有β= 1）7）作为评价指标。损失F1，ma回忆-1召回0回忆1精度−1精密度0精密度1Poisson[3]38.1715.0095.650.0060.0058.670.00NSB[20]36.7055.0067.390.0039.2960.780.00MSE37.5910.0086.967.1433.3356.3433.33CE32.620.0082.6150.000.0060.3241.18UDM39.6350.0078.260.0047.6263.160.00UDM+CS40.915.0082.6128.5733.3356.7240.001. c1>0，c-1>0：阴性分类保守策略，阳性分类积极策略，与临床情况吻合较好。2. c10，c-1>0：对阴性和阳性类都采取保守策略，这是合理的，以防误诊为阳性也会带来严重后果。<3. c1>0，c-10：阴性和阳性两类均采取积极策略，仅适用于早期发现诊断非常重要的疾病。<4. c10，c-10：在负类上采取积极策略，在正类上采取保守策略，这在大多数情况下是不合理的。<<我们以第一种情况为例进行说明。注意c±1强制γ1和γ−1都为正值，这鼓励λ1和λ−1的值更小。注意然后在4.4节中给出我们的实验结果，在4.5节和4.6节中分别给出保守-攻击（c-a）和保守-保守（c-c）策略的实验结果。作为对结果的解释，我们可视化了一些情况，包括第4.7节中的坏情况。最后，我们测试了我们在4.8中预测确定数据的模型，以结束本节。4.1. 数据集对于肺结节分类，我们采用LIDC-IDRI数据集[1]，其中包括1010名患者（1018次扫描）和2660个结节。对于每个结节，有1-7名放射学家绘制轮廓并提供恶性等级评分（1-5）。我们遵循[4，14，27]标记良性和恶性结节。具体地，平均得分（as）高于3.5的病例被标记为恶性;低于2.5为良性;其他（如：2.5-3.5），被这些方法丢弃，在我们的论文中被标记为不确定类。对于AD/MCI/NC分类任务，我们采用ADNI数据集[12]，其中样本为双侧在{f（xi）}N的相同分布下，，结合海马体ROI。如前所述，MCI类是我们只使用λ±1作为阈值参数，两者的较小值可以促使越来越少的样本分别被分类为负类和正类注2：为了简单起见，我们把对负的保守策略和对正的积极策略分别称为c-a策略，其中c±1被鼓励大于0。4. 实验在本节中，我们评估了我们的肺结节（良性/不确定/恶性）分类和AD/MCI/NC分类模型。数据集（LIDC-IDRI和ADNI数据集）的介绍将在第4.1节中介绍，然后分别在第4.2节和第4.3节中介绍实施细节和评价指标我们被认为是不确定的阶级。数据分为1.5T和3.0TMRI扫描磁场强度，1.5T包含64 AD、208 MCI和90NC，3.0T数据集包含66 AD、247 MCI和110 NC。然后实现DARTEL VBM流水线[2]来预处理数据。体素大小为2×2 ×2mm3用于MRI图像。4.2. 实施细节肺结节和海马 ROI 的所有输入图像均裁剪为48×48×48的尺寸。本文将G（·）作为logit此外，我们修改了 DenseNet [13] 作为我们模型的主干（ fw（·））。具体来说，我们用3D卷积层取代了2D卷积层，核大小为3×3×3的标准层。采用两个3×3×3核的3D卷积层，10596−11−11表4.我们的（c-a策略）和LIDC-IDRI数据集上的基线之间的比较，其中βrec=βpre= 2在Fβ中，ma在Eq中。7 .第一次会议。1−1损失Fβ，ma 回忆-1召回0回忆1精度−1精密度0精密度1Poisson[3]66.7266.5150.4785.9461.1868.9756.70NSB[20]69.7724.3186.7574.2286.8959.2768.84MSE60.3690.0947.5744.0093.5946.2326.19CE65.5548.1774.4569.5361.0562.6078.07UDM69.3420.6489.9171.0988.2458.6472.22UDM+CS71.4726.1583.9179.6989.0659.6466.67UDM+CS+CA73.6123.8582.6585.9494.5560.5162.86表5.比较我们的（c-a策略）和ADNI数据集上的基线，Fβ中βrec=βpre= 2，等式中ma。7 .第一次会议。1−1损失Fβ，ma 回忆-1召回0回忆1精度−1精密度0精密度1Poisson[3]26.880.0047.8364.290.0053.6623.68NSB[20]30.0515.0093.480.0037.5059.720.00MSE32.5010.0086.967.1433.3356.3433.33CE32.620.0082.6150.000.0060.3241.18UDM37.550.0082.6164.290.0060.3256.25UDM+CS38.385.0082.6128.5733.3356.7240.00UDM+CS+CA49.4125.0084.7835.7145.4563.9362.50将第一个2D卷积层替换为7×7的内核大小。我们使用了三个大小为（6，12，24）的密集块，而传统的DenseNet121的块大小为（6，12，24，16）。为了保留更多的低级局部信息，我们丢弃了第一个最大池化层，第一个卷积层。我们采用学习率为0.001的ADAM [18]来训练网络。受GPU内存限制，minibatch大小设置为4。对于数据增强，我们对所有训练图像采用随机旋转、移位和转置，以防止过拟合。这两个数据集被分为训练集、验证集和测试集（LIDC-IDRI为1585、412和663; ADNI为625、80和80历元数通过验证集上的性能进行优化。4.3. 评估指标由于我们的任务属于多任务分类，nario，我们采用F β的度量，ma，它是二元分类中Fβ的修改，定义为：第i节课如果7中的所有β都为了评估不同的策略，我们使用加权的精确度和召回率来合并不同的β。在本文中，我们主要考虑两种策略，通过采用不同的βpre和βrec值：• 保守-攻击（c-a）：更多地关注消极类的精确性和积极类的回忆，即，βpre=βrec>1，其他=1• 保守-保守（c-c）：更加关注负类和正类的精度，即，βpre=βpre>1，其他= 1。4.4. 与基线的为了验证我们的模型的有效性，我们将我们的模型UDM与使用CE损失，NSB [20]，Possion模型[3]的densenet进行了比较。此外，我们还比较了另一个哪里Fβ，ma=2·召回率β，ma×精度β，ma召回率β，ma+精度β，ma回收回收（七）方法，将其视为回归问题。虽然它考虑了三个类之间的顺序，但它假设相邻类之间的增量是相同的，这可能与实际情况不符如表中所示2、桌子。召回率β，ma=i={−1，0，1}我我βrec3、我们的模型在这两个任务上都优于其他模型。更多-i={− 1， 0， 1}i拉普雷斯i={−1，0，1}βiPrecisionI此外，通过采用成本敏感（CS）参数，ters（UDM+CS），可以进一步改善结果，缓解不平衡问题。要看到这一点，请注意，精密度β，ma=Σi={− 1，0， 1}预我LIDC-IDRI数据集（表2），与不含精密度i=TPiTPi+ FPi，调用i=TPiTPi+FNi（八）CS，负、正回忆提高5.51%和8.6%。特别是，在ADNI数据集（表3）上，大多数方法严重遭受不平衡的影响-其中TPi、FPi和FNi表示真阳性样本、假阳性样本和假阴性样本苏.在没有CS的情况下，Poisson，NSB，MSE和UDM的阳性召回率几乎为0，β10597−11表6.我们的（c-c策略）与LIDC-IDRI数据集上的基线之间的比较，其中βpre=βpre= 2在Fβ中，ma在Eq.7 .第一次会议。1 −1损失Fβ，ma 回忆-1召回0回忆1精度−1精密度0精密度1Poisson[3]60.3578.4435.0273.4450.2962.3664.83NSB[20]67.3924.3186.7574.2286.8959.2768.84MSE55.5893.4658.2512.0092.5955.0521.43CE67.2521.1084.5478.9190.2058.3966.01UDM66.5835.3284.8664.8479.3859.7871.55UDM+CS67.8733.9481.0779.6979.5761.3467.55UDM+CS+CC68.7229.8287.3872.6686.6760.6170.99表7.比较我们的（c-c策略）和ADNI数据集上的基线，Fβ中βpre=βpre= 2，等式中ma。7 .第一次会议。1 −1损失Fβ，ma 回忆-1召回0回忆1精度−1精密度0精密度1Poisson[3]36.3015.0095.650.0060.0058.670.00NSB[20]30.8815.0093.480.0037.5059.720.00MSE36.2510.0086.967.1433.3356.3433.33CE28.9610.0093.480.0033.3358.110.00UDM36.3950.0078.260.0047.6263.160.00UDM+CS39.685.0082.6128.5733.3356.7240.00UDM+CS+CC42.0325.0076.0921.4335.7159.3242.86表8. 比较UDM+CS+CA和无不确定数据的二元分类器对AD和肺结节（LN）确定数据的预测。“R”,“P” stand for Recall and任务方法F1，maR−1R1P−1P1AD二进制79.1395.0057.1476.0088.89我们84.9595.0071.4382.6190.91LN二进制88.5488.5389.8493.6982.14我们88.9284.8695.3196.8578.71CE.通过利用CE参数，我们的UDM+CS表现得更加平衡，如蓝色所突出显示的。为了进一步验证CS参数对缓解不平衡问题的贡献，我们比较了阈值参数以及每个类别的预测数量如图5，UDM+CS学习的阈值参数（绿线）的幅度小于和不确定类（精确度-1=召回率-1= 0%）。另外，阳性分类预测为阳性或不确定，提示治疗或进一步检查，从而避免不可逆的损失。这种改进可有助于参数 γ±1 。再次，如图 1 中的UDM+CS+CA所示。5、阳性分类阈值参数λ1越小，阳性分类预测病例数越多（185V.S.第153章进攻战略另一方面，负类的阈值参数（ λ−1 ）越小，被预测为负类的病例越少（ 59vs.#36825;，这是一种保守的策略。4.6.保守的保守战略对于c-c策略，我们设置c1=−0。01且c−1= 0。01.Fβ，ma中的βpre=βpre=2（等式（七）. 如Ta所示-−1 1UDM中的那些（黑线），因此可以避免模型偏向不确定的一个（被预测为不确定类的病例数：446（含CS）与467）。4.5.保守的攻击性战略在本节中，我们将c-a策略与其他策略进行对于我们的模型6，c1=c−1=0。01（UDM+CS+CA）。为了更好地度量 c-a 策略，我们在 F β ， ma 中设置βpre=βrec=2（等式10 ）。7 ）对于 c-a 策略。对于LIDC-IDRC，ρ±1= 20，ADNI数据集上分别为=30。如表中所示。4和5，UDM+CS+CA 在以下方面的表现优于 UDM+CS2.14%：LIDC-IDRI数据集和ADNI数据集的Fβ，ma为11.03%。此外，在召回率1和精确率-1方面，UDM+CS+CA比LIDC-IDRI数据集提高了6.25%和5.49%;在ADNI数据集上分别为7.14%和12.12%，与UDM+CS一致.尽管Poisson [3]和CE的召回率1比我们的高，但它们在很大程度上偏向于正布莱。6和7，UDM+CS+CC优于UDM+ CS 0.85LIDC-IDRI数据集上的F β，ma为2.35%，ADNI数据集上的F β，ma为2.35%。同样，UDM+CS+CA提高了3.44LIDC-IDRI精密度1的%和精密度−1的7.10%数据集 ; ADNI 数据集上的 Precision1 为 2.86% ，Precision−1这样的结果验证了我们的模型的有效性，以控制政策到我们的模型。4.7. 可视化我们在图中看到一些肺结节。4.7作为一个例子来说明优于其他人。左上、右上、左下、右下分别对应良性（阴性）、恶性（阳性）、不确定和一些不良病例。结节用绿框标记，图下得分为所列模型的预测概率与良性结节相比，恶性结节体积较大，密度较低（较暗），形态不规则（如：大，大，10598良性恶性137153185467446419596459CE0.350.350.460.23CE0.470.380.400.40泊松0.130.330.660.50泊松0.380.340.380.38NSB0.550.450.330.72NSB0.550.360.450.40我们0.870.710.810.81我们0.720.650.490.81不确定CE泊松NSB我们0.0.0.0.403978540.440.380.540.470.450.340.350.460.240.380.210.51不良案例CE泊松NSB我们0.080.310.030.05良性0.340.270.150.29被尼恩0.040.270.190.15恶性恶性0.240.260.160.35图4.我们的方法（UDM+CS+CA）和肺结节预测基线之间的比较（在地面真实类的概率（得分低于每种情况））左上、右上、左下、右下子图分别表示良性、恶性、不确定结节用绿框标记。来预测它们。我们把局限性的解决2在今后的工作中对硬样品。10−1−2−3UDMUDM+CSUDM+CS+CA4.8. 确定数据在本节中，我们将测试我们的模型预测确定数据的能力（在验证集和测试集中）。作为比较，我们还实现了一个在训练过程中没有不确定数据的二元我们可以图5.三种方法的阈值参数和每类预测数的比较：UDM（黑色）、UDM+CS（绿色）、UDM+CS+CA（红色）。并与血管或胸膜相连。如图所示，所列良性结节密度高，边界光滑，可成功预测的概率高，而其他则失败。恶性肿瘤呈不规则低密度影。例如，最后一个是一个大的部分实性结节（PSN），因此恶性程度很高。我们的模型预测它是良性的，概率很高（0.81），而其他方法预测大约0.40. 不确定结核具有以下部分特征：例如（i）第二和第三个靠近胸膜，以及(ii) 第四个是不规则的。目前还不清楚它们是属于良性还是恶性，我们的模型预测它们是不确定的。我们还列举了一些棘手的案例。同样，它们与没有显式标签的不确定类不同。如右下角所示，有明确的标签，但很难分类。例如，（i）第一个良性结节体积较大，边界光滑，密度高，是典型的良性结节;但它们靠近胸膜。(ii)第一个恶性结节是胸膜凹陷，这是一个恶性属性，但它具有小尺寸。然而，所有的方法，包括我们的方法，预测评分310599从桌子上看。UDM+CS+CA可以在F1，ma（只有负类和正类）方面优于二元模型。特别是，正类的召回率（R1）和负类的精确率（P-1）大大提高，这可以归因于c-a策略。5. 结论本文介绍了医学影像分析中的“不确定数据”。我们提出了一个新的框架来建模这样的数据，并减轻不平衡数据的影响在训练过程中，我们将保守策略和激进策略融入到我们的训练框架中 . 肺结节预测和AD/MCI/NC分类的实验表明，我们的方法在性能和可解释性方面优于其他方法6. 确认这项工作得到了国家自然科学基金资助61625201和61527804以及高通大学研究资助的部分支持。引用[1] Samuel G Armato，Geoffrey McLennan，Luc Bidaut，Michael F McNitt-Gray，Charles R Meyer，Anthony P10600Reeves ， Binsheng Zhao ， Denise R Aberle ， Claudia IHen- schke，Eric A Hoffman，et al.肺部图像数据库联盟（lidc）和图像数据库资源倡议（idri）：一个完整的CT扫描肺结节参考数据库。Medical physics，38（2）：915-931，2011. 4.1[2] 约翰·阿什伯恩一种快速的同构图像配准算法。神经影像，38（1）：95-113，2007年。4.1[3] 克里斯托弗·贝克汉姆和克里斯托弗·帕尔。深序分类的单峰概率分布。国际机器学习会议，第411-419页，2017年。2.2、2、3、4、5、4.4、6、7、4.5[4] 弗雷迪·布雷、雅克·费莱、伊莎贝尔·索乔马塔兰、雷贝卡·L·西格尔、林赛·A·托瑞和艾哈迈丁·杰马勒。2018年全球癌症统计数据：Globocan估计了全球185个国家36种癌症的发病率和死亡率。CA：临床医生癌症杂志，2018年。1、1、4.1[5] Rui M Castro和Robert D Nowak。主动学习的极大极小界限。 IEEE Transactions on Information Theory ， 54（5）：2339-2353，2008. 2.1[6] Nitesh V Chawla，Kevin W Bowyer，Lawrence O Hall，and W Philip Kegelmeyer. Smote：合成少数过采样技术。人工智能研究杂志，16：321-357，2002。2.3[7] 查尔斯·埃尔坎成本敏感学习的基础。17（1）：973-978，2001. 2.3[8] Yoav Freund ， Robert E Schapire ，等 . 用一种新的boosting算法进行实验。见icml，卷96，第148Citeseer，1996年。1[9] Yun Fu和Thomas S Huang.基于判别式老化流形的回归年龄估计IEEE Transactions on Multimedia，10（4）：578-584，2008. 二、二[10] Amanda E Gentry，Colleen Jacksoncook，Debra E Lyon和Kellie J Archer。高维协变量空间中预测癌症分期的惩罚有序回归方法。癌症信息学，2015：201-208，2015。二、二[11] 何海波和爱德华多·加西亚。从不平衡的数据中学习IEEE Transactions on Knowledge Data Engineering ，（9）：1263-1284，2008。2.3[12] Chendi Huang，Xinwei Sun，Jiechao Xiong，and YuanYao. Split lbi：一种具有结构稀疏性的迭代正则化路径神经信息处理系统的进展，第3369-3377页，2016年。4.1[13] Gao Huang，Zhuang Liu，Laurens Van Der Maaten，andKilian Q Weinberger.密集连接的卷积网络。在IEEE计算机视觉和模式识别会议论文集，第4700-4708页，2017年。1、4.2[14] Sarfaraz Hussein，Kunlin Cao，Qi Song，and Ulas Bagci.基于3d cnn的多任务学习在肺结节危险分层中的应用医学成像信息处理国际会议，第249-260页。Springer，2017. 1、4.1[15] Sarfaraz Hussein，Kunlin Cao，Qi Song，and Ulas Bagci.基于3d cnn的多任务学习在肺结节危险分层中的应用医学成像信息处理国际会议，第249-260页。Springer，2017. 1[16] Sarfaraz Hussein ， Robert Gillies ， Kunlin Cao ， QiSong，and Ulas Bagci. Tumornet：使用高斯过程的多视图卷积神经网络进行肺结节表征。arXiv预印本arXiv：1703.00645，2017年。1[17] Salman Hameed Khan ， Munawar Hayat ， MohammedBen- namoun ， Ferdous Ahmed Sohel ， and RobertoTogneri.不平衡数据中深度特征表示的成本敏感学习。IEEE Transactions on Neural Networks ， 29 ： 1-15 ，2018。1、2.3、3.3[18] Diederik P Kingma和Jimmy Lei Ba。Adam：一种随机

下载后可阅读完整内容，剩余1页未读，立即下载