微钙化检测的级联生成和判别学习方法

153 浏览量更新于2023-10-19 收藏 12.51MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

Fandong Zhang1,5∗Ling Luo2,3∗Xinwei Sun2,5Zhen Zhou2,5Xiuli Li2,5Yizhou Yu2Yizhou Wang2,4,5{fd.zhang, z.zhou, yizhou.wang}@pku.edu.cn {luoling, sunxinwei, lixiuli, yuyizhou}@deepwise.com125780乳腺钼靶中微钙化检测的级联生成和判别学习01 北京大学数据科学中心 2 深睿智能实验室 3 北京邮电大学网络空间安全学院 4北京大学电子工程与计算机科学学院计算机科学系 5 鹏城实验室0摘要0准确的微钙化（µC）检测对于早期乳腺癌非常重要，因为它们在早期乳腺癌中占很高比例。大多数先前的µC检测方法属于判别模型，其中利用分类器来区分µCs和其他背景。然而，对于这些方法来说，仍然很难将µCs与大量正常组织区分开来，因为它们太小（最多14个像素）。生成模型可以精确地建模正常组织，并将异常组织（如血管钙化）视为异常值，但它们无法进一步区分µCs和其他异常。在本文中，我们提出了一种混合方法，充分利用了生成模型和判别模型的优势。首先，使用一种名为异常分离网络（ASN）的生成模型生成候选µCs。ASN包含两个主要组件。构建了一个深度卷积编码器-解码器网络来学习图像重建映射，并设计了一个t-检验损失函数来分离µCs的重建残差分布和正常组织的分布。其次，级联了一个判别模型，用于区分µCs和误报。最后，为了验证我们方法的有效性，我们在公共数据集和内部数据集上进行了实验，结果表明我们的方法优于先前的最先进方法。01. 引言0乳腺癌是全球妇女中最常见的癌症[28]。为了在早期发现它，需要进行乳腺筛查[27]。在早期乳腺癌的征兆中，微钙化（µCs）是最常见的一种[2]。为了分析它们，01 作者贡献相同。0乳腺钼靶图像被广泛使用。如图1所示，µCs微小且在亮度、对比度、形状和周围环境中变化多样。放射科医生逐个检测它们显然是困难和耗时的。因此，在乳腺钼靶图像中，具有高准确性的自动µCs检测方法非常重要。0为了实现这个目标，提出了不同的方法，其中大多数是判别模型，即分类模型。通常，从图像中提取各种特征，如harr-like特征[31, 3]、形状和纹理特征[14]和深度特征[4,23]，以训练一个二分类器，可以将µC像素与正常像素区分开来。然而，这些方法面临极度不平衡的样本问题。原因在于µCs通常非常微小，在乳腺钼靶图像中通常小于14个像素，并且这种图像区域的绝大多数是正常组织。因此，对于这样小的对象提取高效特征是具有挑战性的，也导致µC和其他组织的分布非常糟糕。在我们的实验中，正样本（µCs）和负样本（正常组织）之间的比例约为4000:1。0为了解决上述问题，我们首先试图区分正常像素和异常像素，其中µCs属于异常区域。通过这种方式，我们可以减少存在于判别模型中的大量负样本。为此，我们从图像重建的角度重新思考µC检测任务。正常样本是那些常规背景，这些区域非常多。因此，应该不难找到一个字典来重建这些正常样本。相反，µCs是不规则的、罕见的，很难被重建。因此，自然而然地学习一个重建模型，可以很好地重建正常样本，而不是µCs。在本文中，我们设计了一个图像重建网络，它被建模为一个深度卷积编码器-解码器网络，提供了强大的学习能力。125790图1. 乳腺X线照片中微钙化的示意图。(a)来自INBreast数据集[19]，(b)和(c)来自我们的内部数据集。每个子图中的三列分别表示原始乳腺X线照片、放大的微钙化区域和相应的圈出的微钙化区域。大多数微钙化都在1mm范围内，即在70um像素间距的乳腺X线照片中约为14个像素。由于数据来源不同，INBreast数据集和内部数据集的灰度直方图有很大差异。来自(b)和(c)的微钙化在亮度、对比度、形状和周围环境上都显示出多样性。0此外，为了提取这些微小物体的有用特征，我们使用了U-Net[24]作为主干网络。为了进一步提高重建过程的性能，我们设计了一种新的t-test损失，用于使微钙化的残差分布与正常区域的残差分布不同。这种t-test损失受到了两样本t检验的启发，它是一种经典的假设检验方法。我们将其转化为一种数据驱动的损失函数。具体而言，我们将正样本（微钙化）和负样本（正常组织）像素的重建残差视为由重建网络学习到的两个独立的随机变量。我们的t-test损失不是确定这两个分布是否不同，而是尽可能地使重建网络以不同的方式约束这两个分布。由于正常组织易于重建，而微钙化则不易于重建，我们最小化负像素的重建残差，并对正像素进行硬阈值处理，使其大于预设阈值。到目前为止，我们已经解释了所提出的生成模块的所有必要组件，称为异常分离网络（ASN）。重建后，得到包含候选微钙化和其他类型钙化的异常区域。尽管它们都属于钙化，但我们观察到它们在形状上有很大的不同。基于这种特性，我们构建了一个判别模型，即深度二元分类网络，用于对微钙化和其他物体进行分类。这个判别模型旨在实现假阳性减少（FPR）。为了验证所提方法的有效性，我们在公共数据集INBreast[19]上进行了评估。0并且我们在INBreast数据集上实现了每张图像5个假阳性的召回率为78.35%，召回率为10个假阳性的召回率为85.96%；在内部数据集上，召回率为5个假阳性的召回率为90.71%，召回率为10个假阳性的召回率为92.24%，超过了先前最先进的方法。总结起来，我们的贡献主要有三个方面：1）为了解决先前判别模型所面临的不平衡问题，我们提出了一个生成模型来区分正常区域和异常区域，其中包含了微钙化的候选物体。此外，我们应用U-Net来提取这些微小物体的有用特征。2）为了进一步提高性能，我们设计了一种新的t-test损失，以扩大正常区域和异常区域之间的分布差异。3）与先前最先进的方法相比，所提出的ASN在公共数据集和内部数据集上都取得了最佳性能。02. 相关工作02.1. 微钙化检测0大多数现有的微钙化检测方法可以粗略地分为两类：基于图像处理和基于学习的方法。第一类主要基于这样一个事实，即微钙化通常比周围组织更亮且频率更高。乳腺X线照片首先经过小波变换[1,14]增强，然后应用Hessian矩阵响应[20]、形态学滤波[1]等方法来识别微钙化。然而，这些方法容易受到密集组织的影响，并且存在大量的误报。第二类方法基于监督学习。可以训练有效的二元分类器来区分微钙化和其他组织。125800正常组织。Khalaf等人[14]提取了几个形状和纹理描述符，并应用学生t检验和带有RBF核的SVM进行特征选择和训练。在[3]中使用了Harr-like特征[31]，其中训练了一组级联分类器来应对类别不平衡问题。Cai等人[4]应用CNN学习深度特征进行分类。网络是在通过对带通滤波图像进行阈值处理生成的建议上进行训练的。02.2 图像重建0图像重建是将可能存在噪声和模糊的原始图像重建的问题[22]。一种常用的方法是稀疏字典学习，其目标是学习组成字典的元素的稀疏线性表示。通过L1正则化实现的学习表示对遮挡具有鲁棒性。例如，提出了一种基于稀疏编码的分类算法[33]，以成功处理遮挡和损坏在人脸图像的识别中均匀且鲁棒。为了从CNN的强大表示能力中受益，Turchenko等人[30]提出了一个深度卷积自编码器，实现了降维、聚类和图像重建。Kingma和Welling[16]设计了自编码变分贝叶斯算法，它允许我们进行非常高效的近似后验推断，也可以用于识别、去噪、表示和可视化等多个任务。Johnson等人[13]提出了使用感知损失函数来训练前馈网络进行图像转换任务。Goodfellow等人[8]构建了一个通过对抗过程估计生成模型的新框架，可广泛用于图像生成。02.3 两样本T检验0两样本T检验是一种统计假设检验方法，用于确定两组数据是否在统计上显著不同。假设每组样本都是独立同分布于正态分布1，那么计算得到的t统计量在零假设下遵循学生t分布。相应的p值，用于衡量零假设成立的概率，也可以计算出来。因此，当p值小于预定义的阈值α时，可以拒绝零假设，这意味着认为两组数据在统计上显著不同。02.4 异常检测0异常检测，也称为离群值检测，是识别数据中不符合预期行为的模式的问题01 根据中心极限定理，可以放宽正态分布的假设0不符合预期行为的模式，即离群值通常被定义为异常、罕见事件或与最常见或预期模式明显偏离的异常数据[7]。检测离群值可能提供重要信息，例如信用卡欺诈、临床试验中的医疗问题。此外，这些离群值的存在可能导致估计、推断和模型选择等方面的不稳定性。因此，离群值识别是获得稳健参数估计和检测新数据中的异常的关键任务。在我们的论文中，我们将µCs视为离群值，因为正面图像像素的数量与常规负面图像不同，分布也不同。已经提出了各种方法用于离群值检测，包括单变量模型[17]和多变量模型[32, 12,25]。对于无监督的离群值检测，其中异常值未标记，通常可以应用带有Huber损失的鲁棒回归[12]，该方法对正常数据最小化平方损失，对异常数据最小化绝对损失。在[26]中证明了这个方案等价于一个LASSO问题，将异常值的检测转化为模型选择问题。03. 方法0如图2所示，我们的系统主要由两个级联模块组成：异常分离网络（ASN）和假阳性减少（FPR）模型。ASN的输出直接输入到FPR中，FPR预测最终结果。在本节中，我们将分别介绍ASN和FPR。03.1 异常分离网络0ASN包括两个核心组件：深度重建网络和基于T检验损失的重建残差学习。在训练过程中，将乳房X光图像切割成块，并送入深度重建网络。然后对重建残差应用T检验损失，鼓励正常像素的残差较小，而 µC像素的残差较大。在测试过程中，对于每张完整的乳房X光图像，计算重建残差图并基于此预测点和得分。在本节中，我们首先介绍我们的重建网络和重建残差学习，然后解释T检验损失与Huber损失[12]之间的关系，后者广泛用于异常检测。03.1.1 深度重建网络0the great representation ability, we use a U-Net [24] for pix-elwise reconstruction. Our U-Net consists of 3 downsamplestages and 3 upsample stages with skip connections. Eachstage includes 3 convolution layers.We design such a network for three reasons.Firstly,the downsampling operations can lead to effective receptiveﬁeld size, which is advantageous for the reconstruction ofeach pixel and the coherence of reconstructed image. Sec-ondly, sizes of µCs are within 14 pixels. Therefore, we onlydownsample the image by the factor of 8 to avoid too muchinformation loss for reconstruction. Thirdly, the skip con-nections can keep low-level information, which is necessaryfor accurate localization.r(I) = |f(Θ; I) − I|=∑P∈I|f(Θ; P) − P|(f(Θ; P)∆= f(Θ; I)[P])(1)H0 : µx <= µy H1 : µx > µy(2)(σ2xNx +σ2yNy2σ2xNx1Nx−1 +σ2yNy̸(4)S2xNx +S2yNy125810图2.所提出方法的流程图。有两个级联模型：异常分离网络（ASN）和假阳性减少（FPR）模型。ASN的输出直接输入到FPR中，FPR预测最终结果。在ASN的训练过程中，使用乳房X光图像块对基于U-Net的重建网络进行训练。通过对重建残差像素应用T检验损失，将正常残差和 µC残差分离开来。在测试过程中，给定一张乳房X光图像，在预处理后计算重建残差，从而生成预测点（显示为红色圆圈）。FPR模型是一个ResNet50，通过ASN的负样本和真实标签的正样本进行训练。最终的预测是通过得分级别上的两个模型的乘积进行融合。03.1.2 重建残差学习0设 f ( ∙ ) 为重建网络函数。给定一张图像 I，重建残差值为：0其中 P 表示像素， Θ表示重建网络中的参数。正负像素的重建残差应具有不同的分布。因此，我们提出了T检验损失。在接下来的章节中，我们首先回顾两样本T检验，然后证明T检验损失的有效性。两样本T检验给定两组样本 x 1 , ..., x N x iid � N ( µ x , σ 2x ) 和 y 1 , ..., y N y iid � N ( µ y , σ 2 y ) ，0为了测试 µ x > µ y 还是不成立，我们建立了零假设（H0）和备择假设（H 1）[6]，如下所示：0并且使用以下公式生成t统计量：t = ¯x - ¯y / √0其中¯∙表示一组样本的均值，Sx和Sy分别是x和y的样本方差。我们选择接受H1（拒绝H0），如果t ≥tν,α，其中tν,α是具有ν自由度的学生t分布在显著水平α处的临界值，即P(t ≥ tν,α) = α，其中0ν =0Ny - 1，如果σx ≠ σy0Nx + Ny - 2，如果σx = σy0在实际应用中，{xi}i=1,...,Nx和{yj}j=1,...,Ny可能不完全满足正态分布。然而，根据中心极限定理，当Nx和Ny足够大时，¯x和¯y近似于正态分布，在这种情况下，也可以应用双样本t检验。由于正常组织是规则的，而钙化则不是，因此散布分布，我们将自由度估计为0ν =0Nx -0Nx - 1 + S^2y/N0Ny - 1 (5)+̸125820T-test Loss 给定独立的负样本和正样本，我们使用Eq.1计算重构的残差值，表示为{ri p (Θ)}i=1,...,Np和{ri n(Θ)}i=1,...,Nn。在本文的其余部分，为了简化，我们将上述残差值表示为{ri p}i=1,...,Np和{rin}i=1,...,Nn。然后我们提出以下t-test损失函数，0L = max(β - ¯rp, 0) + ¯rn + λpS^2rp + λnS^2rn (6)0其中阈值超参数β表示正负残差分布均值之间的间隔；λp和λn是正则化超参数。最小化这样的t-test损失可以看作是最大化Eq.2中定义的t统计量，该统计量通常用于确定两组数据是否不同。相反，我们的目标是准确分类，即能够以监督方式区分µCs和负图像像素。为了实现这个目标，我们反过来提出通过最小化L来将标记的正像素的重构与负像素分离。更详细地说，注意到max(β - ¯rp, 0) +¯rn希望重构参数(Θ)很好地适应负像素，同时将正像素的重构与负像素保持较大的间隔。换句话说，Θ被训练来学习负像素以及正补丁中除µCs以外的其余像素。因此，对于测试数据中的正像素，Θ可以以较大的间隔进行重构。通过这种方式，它可以成功地预测为正标签，并且相应的残差可以被视为µC。除了Eq.6中的这部分之外，我们还对Sx和Sy进行额外的正则化。如果没有这样的正则化，Θ的估计往往不稳定。这是因为Sx和Sy的大值可以使得rit=n,p很容易变得很小或很大，因为它们倾向于以广泛分布的方式分布。相反，估计误差损失min¯rn +¯rp可能会遇到模型崩溃问题，即学习到的映射函数倾向于成为恒等函数。因此，它们无法对正图像像素的潜在结构进行建模，因此无法推广到在测试阶段检测µC。此外，与估计误差损失相比，我们的损失更加任务驱动，因为它符合测试阶段的异常值检测规则，即如果ri >β，则将补丁i检测为异常值。此外，估计的Θ，它是有监督的(µC被标记)来模拟负(正)样本的残差值小于(大于)阈值参数β，可以直接用于在测试阶段检测µC。因此，t-test损失可以纳入整个端到端的过程，如图2所示。03.1.3与Huber损失的关联0我们声明，所提出的t检验损失，即方程6可以被视为Huber损失[12]的变体，它是一种无监督的异常值检测方法。更详细地说，注意到我们场景中的Huber损失可以写成：0ber损失[12]的变体，它是一种无监督的异常值检测方法。更详细地说，注意到我们场景中的Huber损失可以写成：0LHuber(Θ) =0i = 1 ρβ(Pi, f(Θ; Pi)) (7)0其中N表示训练集中的补丁数量，0ρβ(Pi, f(Θ; Pi)) = { 1 2 (Pi − f(Θ; Pi))2 , ��Pi − f(Θ; Pi)�� β β(��Pi − f(Θ; Pi)�� − 102β)，否则（8）0方程7是平方损失（均值无偏估计器）和绝对损失（中值无偏估计器）的组合。在[26]中已经证明，最小化方程7等价于0minΘ0Nn∑0i = 101 2 (Pin − f(Θ; Pin) − γi)20Np∑0i = 101 2 (Pip − f(Θ; Pip) − γi)2 +λ∥γ∥1，(9)0如果i是异常值，即γi ≠ 0，当且仅当��Pi − f(Θ; Pi)�� >β。这里的异常值是未标记的，可以被视为具有γ的非零值的元素。在我们的实验中，训练数据中的异常值（正图像像素Pp）是有标签的。因此，为了消除这些异常值的偏离效应，我们反过来提议满足Huber损失中的定义的这些异常值，即对于每个i，��Pip − f(Θ; Pip)�� >β。结合对Pn的绝对损失，总损失可以相应地设计为：0�L = max(β − ¯rp, 0) + ¯rn. (10)0期望的¯rp应大于阈值参数β，这是Huber损失中约束条件的放宽，以实现更强的鲁棒性和更好的泛化性。通过消除异常值的影响，可以实现对Θ的鲁棒估计，进而可以准确地检测测试数据中的异常值。此外，我们还额外对方差进行正则化，以防止不稳定的参数估计，如前面所述。03.1.4设置超参数0阈值参数β >0与显著性水平α成反比。从异常值检测的角度来看，它是“掩盖效应”和“淹没效应”之间的权衡[12]。太小的β可能导致错误地将负像素识别为异常值，即淹没效应；而太大的β可能导致遗漏一些异常值，即掩盖效应。FPN FRCN39.7271.4772.4872.4872.48U-Net w FPR29.4577.6182.8483.6784.50̸125830图3.比较血管钙化（左侧，用绿色矩形标记）与µCs（右侧，用橙色圆圈标记）的示例。0表1. INBreast数据集的评估结果（%）。0方法 R@1 R@5 R@10 R@15 R@200提出的方法 36.70 78.35 85.96 88.26 88.900较大的λs =n,p可能导致遗漏一些异常值，即掩盖效应。较大的λp ≠λn意味着对方差进行更多的正则化。在我们的实验中，µC是不规则的，因此重建可能会有很大的变化。因此，对Sp进行较大的正则化是合理的，以防止Sp过大。正如实验部分所示，当λp > λn时，给出了最佳的预测结果。03.2.假阳性减少0提出的ASN可以很好地重建正常组织，并将µCs视为异常。然而，在乳腺X线照片中存在各种钙化。如图3所示，左侧补丁中的绿色矩形是血管钙化，可以被视为许多钙化像素。对于ASN来说，它们也是重建的异常值，即使它们在形状上与真实的µCs非常不同，如图3右侧补丁中的橙色圆圈所示。然而，对于判别模型来说，它们并不难区分。因此，我们级联了一个深度分类网络来进一步减少误报。我们在FPR阶段使用ResNet50[10]。给定一张图像，我们在ASN生成的重建残差图上使用一个简单的阈值。对于每个连通分量，我们使用中心作为预测位置，使用重建残差值的总和作为其ASN分数。对于每个ASN预测，我们裁剪并调整大小为224×224的56×56大小的补丁，然后输入ResNet50。我们将ASN和FPR分数的乘积作为最终分数。04. 实验04.1. 实现细节0乳腺X线摄影图像通常以DICOM格式以12位或14位数据的形式存储。为了将其转换为8位灰度图像，我们将所有原始像素线性映射到0�255的范围内。0表2. 内部数据集上的评估结果（%）。0方法 R@1 R@5 R@10 R@15 R@200FPN FRCN 78.27 81.33 81.33 81.33 81.33 U-Net w FPR84.90 88.06 88.67 88.67 88.670提出的模型 85.31 90.71 92.24 92.65 92.760对于图像，我们简单地将所有原始像素映射到0�255的线性范围内。预处理方面，我们首先将图像归一化为具有相同像素间距的70µm。然后，我们使用Otsu方法[21]对乳腺区域进行分割，并去除乳腺X线摄影图像的背景。我们使用pytorch实现了所提出的模型。ASN是从头开始训练的，权重由[9]初始化。我们使用Adam[15]进行训练，权重衰减为10^-4，初始学习率为0.001。梯度和其平方的滑动平均值分别为0.9和0.999。方程6中的边界参数β设为0.8，而权重参数λp和λn分别设为1和0.1。在训练过程中，乳腺X线摄影图像被裁剪成112×112大小的补丁，并输入ASN进行训练。我们不使用整个图像，因为它们通常具有较高的分辨率（例如约3500×2500像素），对于内存限制来说太大了。我们对正负样本进行1:1的采样以提取更多的候选框。FPR模型是在ImageNet上预训练的。我们使用学习率从0.001开始的SGD进行训练。ASN的所有预测结果和所有标准答案微钙化灶被用于训练FPR模型，没有进行额外的采样。04.2. 数据集0我们在一个名为INBreast[19]的公共数据集和一个内部数据集上评估性能。有几个公共的乳腺X线摄影数据集，例如MIAS [29]、DDSM[11]、INBreast等。我们选择INBreast数据集，因为图像质量和微钙化注释相对较好。INBreast包含115个病例，410张乳腺X线摄影图像，其中两位放射科医生发现了6880个微钙化灶。在过滤掉直径大于1mm的微钙化灶后，我们选取了5782个微钙化灶进行实验。我们将数据集随机划分为训练集、验证集和测试集，比例为3:1:1。详细的划分情况请参见补充材料。我们还收集了一个内部数据集进行进一步评估，该数据集包含439个病例和1799张图像。不同年份但同一女性的图像被视为同一病例。两位有超过10年经验的放射科医生对数据集进行了注释。我们选取了7588个被两位放射科医生识别出的微钙化灶作为标准答案。我们将339个病例、1386张图像和5479个微钙化灶作为训练集，50个病例、208张图像和1129个微钙化灶作为验证集，50个病例、205张图像和980个微钙化灶作为测试集。10−1011020.00.20.40.60.810−1011020.00.20.40.60.8U-Net43.3958.3572.2082.0285.32ASN44.1365.1478.7284.9588.35U-Net86.6388.3788.6788.6788.67ASN88.1690.0091.3391.8492.24125840每张图像的误报数0召回率0FPN FRCN ASN提出的 U-NetU-Net w FPR0INbreast数据集上的FROC曲线0图4. INBreast数据集上的FROC曲线。0每张图像的误报数0召回率0FPN FRCN ASN提出的 U-NetU-Net w FPR0内部数据集上的FROC曲线0图5. 在内部数据集上的FROC曲线。04.3. 基线方法0对于这两个数据集，我们构建了两个基线模型：FPNFRCN：使用特征金字塔网络（FPN）[18]的Faster RCNN[23]。FPN是一种专门用于小物体检测的先进模型。我们使用ResNet50作为主干网络。对于每个预测的边界框，我们使用中心点进行最终评估。U-Net wFPR：使用FPR的U-Net。U-Net[24]已被证明对于医学图像分割非常有效。跳跃连接对于小物体分割非常有帮助。在这里，我们将U-Net与ASN进行比较，以验证所提出的生成模型的有效性。为了处理极度不平衡的样本，并且与所提出的模型进行公平比较，我们设计了一个与ASN类似的两阶段分割模型。我们首先使用与ASN相同的网络结构通过交叉熵损失进行监督训练分割任务。我们还对正负样本进行1:1的采样以提取更多的候选框。我们选择预测掩码的连通区域作为类似于所提出方法的候选框。然后，级联一个FPR模型以减少误报。0表3. 在INBreast数据集上的候选评估结果（%）。0方法 R@5 R@10 R@15 R@20 R@300表4. 在内部数据集上的候选评估结果（%）。0方法 R@5 R@10 R@15 R@20 R@3004.4. 性能0我们报告了每张图像的假阳性为k时的召回率（简写为R@k），其中k∈{1, 5, 10, 15, 20}为最终模型，k∈{5, 10, 15,20,30}为候选模型。如果至少有一个预测点与微钙化之间的距离小于1mm，则将其视为召回。如表1和2所示，所提出的模型在两个数据集上均优于现有方法。FPN模型的召回率相对较低的主要原因是一些微钙化非常微小（≤5个像素）。FPN的最细粒度预测级别的分辨率相对于原始图像仅为1/4。对于图6中的前3个示例，FPN无法检测到任何一个。此外，小尺寸还意味着RPN中的正锚点较少，这可能导致召回率较低。U-Net模型可以处理小尺寸的微钙化，因为它们进行像素级预测。然而，一些模糊的样本仍然具有挑战性，并且在第一阶段被错过，而所提出的模型对它们的影响较小。表3和4显示了候选定量评估结果。ASN在两个数据集上的性能优于U-Net约3%。根据图4和5，ASN的召回率和假阳性率均高于U-Net，这表明生成方法对微钙化和其他噪声异常更敏感。图6的第四行显示了一个血管钙化的示例，ASN将其预测为微钙化。血管钙化区域可以看作是非常局部的钙化像素的组合。然而，它们在全局模式上与微钙化非常不同，这对FPR模型来说并不困难。简而言之，生成模型和判别模型在某种程度上是互补的。因此，所提出的模型可以充分发挥两者的优势，实现更高的召回率和更低的假阳性率。04.5. 消融研究0为了验证t-test损失的有效性，我们首先训练一个简单的重构模型，其损失函数最小化原始图像和重构图像之间的均方误差。然而，该模型似乎崩溃成一个简单的模糊函数，重构残差中只出现了一些高频内容。它无法识别大多数微钙化。这种现象也表明，L136.7078.3585.9688.2688.90L237.4180.0085.4187.9888.53SmoothL135.8378.2685.2387.9889.08L1 w/o λ29.9072.0283.3086.0686.88125850图6.INBreast数据集中检测结果的比较示例。医生的注释绘制在第二列中，用青色圆圈表示。第三至第六列显示了所提出模型与现有模型之间的比较。每个检测到的钙化物都以圆圈的形式显示在预测位置的中心。0所提出的t-test损失是必不可少的。然后，为了验证正则化的必要性，我们设置λp = λn =0，损失函数变为公式10，即没有负残差和正残差方差的正则化。我们的改进与表5中的最后一行相比的提升可能是因为正则化可以避免估计结果过于分散，从而使残差不稳定。此外，我们比较了一些变体以揭示不同组件的贡献。在公式1中，使用L1距离计算重构残差。我们将其替换为L2和SmoothL1[23]以进一步研究其影响。如表5所示，这些变体产生了可比较的结果。05. 讨论和结论0在本文中，我们提出了一种新的模型，通过将一个判别模型级联到一个生成模型中，来解决乳房X线图像中微钙化检测问题。微钙化非常微小，对正常组织来说也很罕见，这对判别模型来说是一个挑战。我们首先提出了一种名为异常分离网络（ASN）的新型生成模型来提取候选区域，然后训练一个分类模型。0表5. INBreast数据集上的消融研究（%）。0方法 R@1 R@5 R@10 R@15 R@200将ASN作为假阳性减少（FPR）模型的分类网络。在ASN中，应用深度卷积编码器-解码器网络学习重建，并提出了t-检验损失函数以监督训练该网络。在公共和内部数据集上的实验证明，我们的模型优于先前的最先进方法。然而，当µCs过于接近时，对于所提出的方法仍然具有挑战性（图6的最后一行）。在未来，我们将继续研究这个问题。此外，我们将尝试使整个流程训练成端到端的方式。0致谢0该工作部分得到了NSFC-61625201、61527804的支持。125860参考文献0[1] 乳腺钙化图像的良性钙化检测。[2] Ulrich Bick.乳腺X线摄影术：如何解释微钙化。Springer Milan, 2014. [3] A.Bria, N. Karssemeijer, and F. Tortorella.学习不平衡数据：一种基于级联的检测聚集微钙化的方法。Medical Image Analysis, 18:241–252, 2014. [4] Guanxiong Cai, YanhuiGuo, Yaqin Zhang, Genggeng Qin, Yuanpin Zhou, and Yao Lu.一种基于深度卷积神经网络的全自动微钙化检测方法。In Proc.SPIE 10575, Medical Imaging 2018: Computer-AidedDiagnosis, 2018. [5] Varun Chandola, Arindam Banerjee, andVipin Kumar. 异常检测：一项调查。ACM Computing Surveys,41(3):15, 2009. [6] B Efron and T Hastie.计算机时代的统计推断：算法。Evidence and Data Science,Institute of Mathematical Statistics Monographs, 2016. [7] GEnderlein. Hawkins, d. m.: 异常值的识别。chapman and hall,london new york 1980, 188 s., 14, 50. Biometrical Journal,29(2):198–198, 1987. [8] Ian J Goodfellow, JeanPouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley,Sherjil Ozair, Aaron Courville, and Yoshua Bengio.生成对抗网络。Advances in Neural Information ProcessingSystems, pages 2672–2680, 2014. [9] Kaiming He, XiangyuZhang, Shaoqing Ren, and Jian Sun.深入研究整流器：在图像分类中超越人类水平的性能。In IEEEInternational Conference on Computer Vision, pages1026–1034, 2015. [10] Kaiming He, Xiangyu Zhang, ShaoqingRen, and Jian Sun. 图像识别的深度残差学习。computer visionand pattern recognition, pages 770–778, 2016. [11] M. Heath,K. Bowyer, D. Kopans, R. Moore, and P. Kegelmeyer.乳腺筛查数字数据库。Springer Netherlands, 2001. [12] Peter JHuber. 鲁棒统计。In International Encyclopedia of StatisticalScience, pages 1248–1251. Springer, 2011. [13] JustinJohnson, Alexandre Alahi, and Fei Fei Li.实时风格转移和超分辨率的感知损失。In European Conferenceon Computer Vision, pages 694–711, 2016. [14] Aya F Khalafand Inas A Yassine.基于小波和统计分析的数字乳腺X线摄影图像微钙化检测的新特征。In IEEE International Conference on Image Processing, pages1825–1829, 2015. [15] Diederik Kingma and Jimmy Ba. Adam:一种随机优化方法。In International Conference on LearningRepresentations, pages 1–13, 2015. [16] Diederik P Kingmaand Max Welling. 自动编码变分贝叶斯。arXiv:1312.6114, 2014.[17] LaurieDavies and UrsulaGather.多个异常值的识别。Publications of the American StatisticalAssociation, 88(423):782–792, 1993.0[18] Tsung Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He,Bharath Hariharan, and Serge Belongie.特征金字塔网络用于目标检测。In IEEE Conference on ComputerVision and Pattern Recognition, pages 936–944, 2017. [19]IC1 Moreira, I Amaral, I Domingues, A Cardoso, MJ Car- doso,and JS Cardoso. Inbreast:朝着全场数字乳腺X线摄影数据库。Academic Radiology,19(2):236–248, 2012. [20] Marimuthu Muthuvel, BalakumaranThangaraju, and Gowr- ishankar Chinnasamy.基于海森矩阵的多尺度乘积和tsallis阈值方案的微钙化簇检测。Pattern Recognition Letters, 94:127–133, 2017. [21] N Otsu.一种从灰度直方图中选择阈值的方法。IEEE Trans Smc,9(1):62–66, 1979. [22] Raviv Raich and Alfred O Hero.部分已知模糊函数的稀疏图像重建。pages 637–640, 2006. [23]Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Fasterr-cnn: 用于实时目标检测的区域建议网络。In InternationalConference on Neural Information Processing Systems, pages91–99, 2015. [24] Olaf Ronneberger, Philipp Fischer, andThomas Brox. U-net: 用于生物医学图像分割的卷积网络。InInterna

下载后可阅读完整内容，剩余1页未读，立即下载