通过选择性推断计算图像分割的有效p值

14 浏览量更新于2023-10-24 收藏 13.64MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

95530通过选择性推断计算图像分割的有效 p 值0田崎浩介1，桥本典明1，稻津裕2，本谷秀方1，竹内一郎1,2*01名古屋工业大学，2理化学研究所0摘要0图像分割是计算机视觉中最基本的任务之一。在许多实际应用中，正确评估个体分割结果的可靠性至关重要。在本研究中，我们提出了一种新的框架，通过统计检验对象区域和背景区域之间的差异来量化个体分割结果的统计显著性，即 p值。这个看似简单的问题实际上非常具有挑战性，因为由于分割算法对数据的适应，差异（称为分割偏差）可能会具有欺骗性地很大。为了克服这个困难，我们引入了一种称为选择性推断的统计方法，并开发了一个计算有效 p值的框架，其中适当考虑了分割偏差。虽然所提出的框架可能适用于各种分割算法，但我们在本文中专注于基于图割和基于阈值的分割算法，并开发了两种用于计算这些算法得到的分割结果的有效 p值的具体方法。我们证明了这两种方法的理论有效性，并通过将它们应用于医学图像的分割来证明它们的实用性。01. 引言0图像分割是计算机视觉中最基本的任务之一。分割算法通常被制定为优化某种损失函数的问题。例如，在基于阈值（TH）的分割算法中，损失函数是基于给定区域内的相似性和不同区域之间的不相似性来定义的。在基于图割（GC）的分割算法中，损失函数是基于给定区域内相邻像素的相似性和边界处相邻像素的不相似性来定义的。根据问题和目标图像的特性，必须选择适当的分割算法。0* 通信联系人：I.T.（电子邮件：takeuchi.ichiro@nitech.ac.jp）。0在许多实际的非平凡应用中，可能存在获得不正确的分割结果的风险。在将分割结果用于高风险决策或作为更大系统的组成部分的实际问题中，正确评估其可靠性至关重要。例如，当将分割结果用于计算机辅助诊断系统时，应能够适当地量化所获得的个体分割的假阳性发现的风险。如果有多个带有基准标注的分割结果可用，可以通过接收器操作特性（ROC）曲线分析来量化整体假阳性发现的预期比例。另一方面，当没有基准分割结果可用时，量化评估个体分割结果的可靠性是具有挑战性的。0在本研究中，我们提出了一种称为后分割推断（PSegI）的新框架，用于在只有空图像（我们知道其中不存在对象）可用时量化个体分割结果的统计显著性，即 p值。为简单起见，我们仅关注将图像分割为对象区域和背景区域的分割问题。为了量化个体分割结果的可靠性，我们利用了一种统计假设检验来确定两个区域之间的差异（见第2节中的（2））。如果差异足够大，并且在空图像（即不包含特定对象的图像）中观察到这样大的差异的概率足够小，那么说明分割结果在统计上是显著的。统计假设检验的 p值可以用作个体分割结果的定量可靠性度量；即，如果 p值足够小，那么意味着分割结果是可靠的。0虽然这个问题似乎相当简单，但是对于上述统计假设检验来说，计算一个有效的p值是具有挑战性的，因为即使在不包含特定对象的空图像中，对象和背景区域之间的差异可能会具有欺骗性地变大，因为分割算法将图像分割为尽可能不同的两个区域。我们将这种分割结果中的欺骗性差异称为分割偏差。xp,†The proposed PSegI framework can be easily extended to cases wherean image is divided into more than two regions.95540可以解释为分割偏差的产生是因为图像数据被使用了两次：一次是使用分割算法将对象和背景区域划分开，另一次是用于测试两个区域的平均强度之间的差异。这种数据分析在统计学中通常被称为双重使用[19]，并且已经认识到在双重使用数据分析中，简单计算的p值具有很高的偏倚性。图1展示了一个简单模拟中的分割偏差。在提出的PSegI框架中，我们通过引入一种最近发展起来的统计方法，即选择性推断（SI），克服了这个困难。选择性推断主要用于特征选择后线性模型系数的统计分析，可以解释为双重使用的一个例子[12, 31, 33, 22, 20, 36, 29, 34, 32,10]。据我们所知，由于难以考虑分割偏差，统计检验方法从未成功地用于评估分割结果的可靠性。我们的论文有三个主要贡献。首先，我们提出了PSegI框架，将量化单个分割结果的可靠性问题形式化为一个SI问题，使得该框架可能适用于各种现有的分割算法。其次，我们具体研究了基于GC的分割算法[5, 2]和基于TH的分割算法[24,38]作为示例，并开发了两种具体的PSegI方法，称为PSegI-GC和PSegI-TH，用于计算使用这两种分割算法获得的分割结果的有效p值。最后，我们将PSegI-GC和PSegI-TH方法应用于医学图像以证明它们的有效性。0相关工作。已经开发了各种具有不同损失的图像分割算法，这些算法结合了目标图像的各种属性[21, 11,41]。分割算法的性能通常是基于人工注释的真实数据集来衡量的。用于分割算法的常用评估标准之一是曲线下面积（AUC）。不幸的是，诸如AUC之类的标准无法用于量化单个分割结果的可靠性。分割问题也可以看作是一个将像素分类为对象和背景两类的二分类问题。许多二分类算法可以提供一定程度的置信度，即通过估计后验概率来确定给定像素属于对象还是背景[18, 17, 25, 15]。虽然0*SI方法的主要思想最早在[20]中首次开发，用于计算LASSO[35]的系数的p值。这个问题可以解释为双重使用数据分析的一个实例，因为训练集被使用了两次：一次用于使用L1惩罚拟合选择特征，另一次用于测试所选特征的系数的统计显著性。0虽然置信度测量可以用于评估给定像素的相对可靠性，但它们并不量化分割结果的统计显著性。在相反的方法中，关于从嘈杂图像中检测到的对象的可靠性的讨论已经进行过类似的研究[8, 7, 26,37]。然而，不幸的是，相反的方法没有正确考虑分割偏差，并且[26]中讨论的可靠性度量不能用作p值。0符号。在本文的其余部分中，我们使用以下符号。对于标量s，sgn( s ) 是 s 的符号，即如果 s ≥ 0，则 sgn( s ) =1，否则为 -1。对于条件 c，1 { c } 是指示函数，如果 c为真则返回 1，否则返回 0。对于小于 n 的自然数 j，e j是一个长度为 n 的向量，其第 j 个元素为 1，其余元素为0。类似地，对于集合 S � { 1 , . . . , n }，e S 是一个 n维向量，其中 S 中的元素为 1，其余元素为 0。对于自然数n，I n 表示 n × n 的单位矩阵。02. 问题设置0考虑一个具有 n个像素的图像。我们将经过适当的滤波操作预处理后的像素值表示为 x 1 , . . . , x n ∈ R，即 n 维向量 x := [ x 1 , . . . ,x n ] � ∈ R n表示预处理图像。为简单起见，我们只研究将图像分割为两个区域的分割问题†。我们将这两个区域称为对象区域和背景区域，以便明确。在应用分割算法后，n个像素被分类为两个区域之一。我们将被分类为对象区域和背景区域的像素集合分别表示为 O 和B。使用这个符号，分割算法 A 被认为是一个将图像 x映射到像素集合 O 和 B 的函数，即 {O , B} = A ( x )。02.1. 测试单个分割结果0为了量化单个分割结果的可靠性，考虑一个表示对象区域和背景区域差异程度的得分 Δ。如果得分以 Δ = η � x的形式写出，其中 η ∈ R n 是任意的 n 维向量，那么PSegI框架可以应用于任何得分。例如，如果我们将对象区域和背景区域的平均像素值表示为0m ob = 1|O|0p ∈O x p , m bg= 10|B|0�0并将 η 0η i = � sgn( m ob − m bg ) / |O|，如果 i ∈O，sgn( m bg − m ob ) / |B|，如果 i ∈ B，̸p = PH0�,(3)95550(a) 原始图像 (b) 分割结果0(c) 像素分布0强度0强度0(d) 对象和背景直方图0图 1：示意图，说明了在测试使用分割算法获得的对象和背景区域之间差异的统计显著性时出现的分割偏差。 (a) 从 N (0 . 5 ,0 . 1 2 ) 中随机生成的包含 n = 400 个像素的图像。 (b) 使用本文中的局部阈值分割算法获得的分割结果。 (c)像素强度的分布和直方图。 (d)对象区域（白色）和背景区域（灰色）的像素强度的直方图。请注意，即使对于不包含特定对象的图像，对象区域和背景区域的像素强度也明显不同。因此，如果我们简单地计算差异的统计显著性，p 值（在 (d) 中的 naive-p）将非常小，表明它不能用于正确评估分割结果的可靠性。在本文中，我们提出了一种计算有效 p 值（在 (d) 中的selective- p）的新框架，该框架正确考虑了分割偏差。0那么得分 Δ表示对象区域和背景区域之间像素值的绝对平均差异0Δ = | m ob − m bg | . (1)0在接下来的内容中，为了简化起见，我们假设得分 Δ的形式为 ( 1 )，但是可以使用任何形式为 η � x的其他得分。其他具体示例在附录 A 中讨论。如果差异 Δ足够大，那么说明分割结果是可靠的。正如在第 1节中讨论的那样，由于分割偏差的影响，正确评估差异 Δ的统计显著性是非平凡的。为了量化差异 Δ的统计显著性，我们考虑以下零假设 H 0 和备择假设 H 1的统计假设检验：0H0: μ_ob = μ_bg vs. H1: μ_ob ≠ μ_bg，(2)0其中μ_ob和μ_bg分别是对象区域和背景区域像素强度的真实均值。在零假设H0下，我们假设图像仅由背景信息组成，并且背景信息的统计变异性可以由n维正态分布N(μ，Σ)表示，其中μ∈Rn是未知均值向量，Σ∈Rn×n是协方差矩阵，可以从独立数据中已知或估计得到。在实践中，我们从一个我们知道不存在对象的空图像中估计协方差矩阵Σ。例如，在医学图像分析中，假设存在这样的空图像是很常见的。0在标准统计检验中，p值是基于零分布PH0(Δ)计算的，即在零假设下测试统计量Δ的抽样分布。一方面，如果我们在不考虑{O，B}是通过分割算法获得的情况下，简单地从O和B的像素强度计算p值，这些简单的p值会由于分割偏差而被严重低估，因此无法正确控制发现错误分割结果的概率。0选择性推断。SI是一种条件推断类型，其中基于零假设下的条件抽样分布对测试统计量进行检验。在我们的问题中，为了考虑分割偏差，我们考虑在分割结果条件下测试差异Δ。具体而言，选择性p值定义为0� Δ > Δ_obs �� A(x) = A(x_obs)z(x) = z(x_obs)0其中上标obs表示相应随机变量的观察量。在（3）中，第一个条件A(x) =A(x_obs)表示我们只考虑分割结果（O，B）与我们从实际图像数据中观察到的相同的情况。第二个条件z(x) =z(x_obs)表示与随机变量x对测试统计量Δ（无条件地）独立的分量与观察到的分量相同。0‡ 在无条件情况下，条件z(x) =z(x_obs)不会改变抽样分布，因为η�x和z(x)是（边际）相互独立的。��,�� = � � ��| � � = �, �,,,,�� z(x) = (In − cη⊤)x with c = Ση(η⊤Ση)−1.(V∗s , V∗t ) = arg min(Vs,Vt) Lcut(Vs, Vt).(4)295560图2：所提出的PSegI框架中使用的基本思想的示意图。通过将分割算法A应用于数据空间Rn中的图像x，得到分割结果{O，B}。在PSegI框架中，统计推断是在子空间S = {x ∈ Rn| A(x) ={O，B}}条件下进行的；即选择子空间，使得从子空间中获取的图像具有相同的分割结果{O，B}。0分量z(x)可表示为0图2显示了所提出的PSegI框架中使用的基本思想的示意图。02.2. 基于图割的分割0作为分割算法A的两个示例之一，我们考虑[5,2]中的基于图割的分割算法。在基于图割的分割算法中，目标图像被认为是一个有向图G ={V，E}，其中V和E分别是节点和边的集合。设P为所有n个像素的集合，N为每个像素到其八个相邻节点的所有有向边的集合（每个像素与其水平、垂直和对角线相邻像素相连）。此外，考虑两个终端节点S和T。然后，图G的V和E定义为V= P ∪{S，T}和E = N ∪ �0p ∈P { ( S, p ) , ( p, T ) }，其中对于两个节点p和q，(p,q)表示从p到q的有向边。在图的每条边(p, q) ∈E上，根据像素强度定义非负权重w(p,q)（见§3.2）。在基于GC的分割算法中，通过将图形切割成两部分来进行对象和背景区域的分割。让我们写出有序划分的表示0是独立的。另一方面，在A(x) = A(x obs)的条件下，η �x和z(X)不是条件独立的。详见[12，20]。0将图形表示为(V s, V t)，其中V s和Vt构成V的一个划分。如果S ∈ V s和T ∈ V t，则有序划分(Vs, V t)称为s-t割。令E cut � E为边集(p, q) ∈E，其中p属于V s，q属于V t。s-t割的代价函数定义为L cut0(p,q) ∈E cutw(p,q)。基于GC的分割算法被表述为寻找最优s-t割的优化问题：0然后，分割结果{O, B}可表示为O ← V � s \ {S}和B ← V � t \{T}。最小割问题（4）被认为是最大流问题的对偶问题，存在多项式时间算法[13，14，9]。在几种最大流问题的实现中，我们采用了[4]中提出的方法，其中包括三个阶段，称为增长阶段、增广阶段和采纳阶段。简要地说，在增长阶段获得从S到T的路径。选择路径中权重最小的边，并将路径上的所有权重减去最小权重以考虑增广阶段的流量。在采纳阶段重建更新后的图的数据结构（详见[4]）。02.3. 基于阈值的分割0接下来，我们简要描述基于阈值的分割算法[27]。在基于阈值的分割算法中，像素根据其强度是大于还是小于某个特定阈值而被简单地分类为对象或背景类。根据应用和目标图像的特点，已经提出了各种确定阈值的方法。接下来，我们首先描述一个全局阈值算法，其中整个图像使用一个单一阈值，然后介绍一个局部阈值算法，其中不同的像素使用不同的阈值。在Otsu[24]提出的方法中，选择一个全局阈值以最大化对象和背景像素之间的差异。这里，差异被定义为最大化区域间方差并最小化区域内方差。由于这两个方差之和是总方差，且不依赖于阈值，我们只能最大化前者。将值大于（或小于）阈值t的像素的数量、均值和方差分别表示为nt、μt和σ2t（或nt、μt和σ2t），则使用阈值t的区域间方差表示为0n 2。全局阈值然后确定为t � = arg max t σ 2 bet ( t)。尽管这个算法很简单，但在许多实际应用中被使用。局部阈值化方法允许更灵活的PH095570由于阈值是针对每个像素确定的，所以分割是逐像素进行的。White和Rohrer[38]提出的方法通过将像素的强度与其邻居的平均像素强度进行比较来确定像素的阈值。这里，邻居是指像素周围的一个正方形窗口，像素的局部阈值确定为t * p = |W p | - 1 � q∈W p x q /θ，其中Wp是像素p周围窗口内的像素集合，θ是基于图像属性指定的标量值。03. 分割后推断0在本节中，我们考虑的问题是如何为图像 x上的对象和背景区域之间的平均像素强度差异提供一个有效的p值，当这两个区域是通过将分割算法 A 应用于图像 x而获得的时。在提出的PSegI框架中，我们通过考虑在零假设下，即 μ ob = μ bg，即对象和背景区域的实际平均像素强度相同的条件下，Δ的抽样分布来解决这个问题，其中条件为 A ( x ) = {O , B}。通过对分割结果 {O , B}进行条件处理，可以正确地纠正分割偏差的影响。根据定义，有效的p值必须被解释为获得的分割结果 {O , B}不正确的概率的上界。为了达到这个目的，在我们的条件推断中，有效的p值 p 必须满足0p ≤ α 当且仅当 A ( x ) =A ( x obs ) z ( x ) = z ( x0α ∈ [0 , 1] 时，α为任意值。 (5)0当且仅当 p 在 [0 , 1]上均匀分布时，这个性质才成立。因此，我们的问题被转化为当测试统计量遵循 ( 3 )中的条件抽样分布时，计算测试统计量 Δ的一个函数的问题。在3.1节中，我们首先介绍了我们提出的PSegI框架的主要结果。在这里，我们展示了如果事件 A (x ) = {O , B} 由 x上的有限一组二次不等式来描述，那么可以精确计算有效的p值。在3.2节和3.3节中，作为所提出的PSegI框架的示例，我们分别开发了基于GC的分割算法 [ 5 , 2 ]和基于TH的分割算法 [ 24 , 38 ]的具体方法。我们的关键发现是事件 A ( x ) = {O , B}可以通过 x的有限一组二次不等式来描述，因此可以使用3.1节中的结果来计算有效的p值。03.1. 分割结果的选择性推断0下面的定理是所提出的PSegI框架的核心。0§ 由于分割偏差，朴素的p值不能满足这个性质。0定理1. 假设大小为 n 的图像 x 是从未知的 n 维正态分布 N( μ , Σ) 中抽取的，其中 μ 是未知的，Σ是已知的或可独立估计的。如果事件 A ( x ) = {O , B} 由 x上的一组形如下式的二次不等式描述0x � A j x + b � j x + c j ≤ 0 , j = 1 , 2 , . . . , (6)0其中 A j ∈ R n × n , b j ∈ R n , 且 c j ∈ R , j = 1 ,2 , . . . ，那么0p = 1 - F E ( z ( x obs )) 0 , η � Σ η ( | m ob - m bg | )(7)0是一个有效的p值，它满足 ( 5 )，其中 F E m,s 2是具有均值 m ，方差 s 2 和截断区间 E的截断正态分布的累积分布函数。这里，截断区间写作0E ( z ( x )) = Σ0当 Δ > 0 时 ( z ( x ) + Δ y ) � A j ( z ( x ) +Δ y ) + b � j ( z ( x ) + Δ y ) + c j ≤ 00且0其中 y = Σ η � η / ( η � Σ η ) .0定理1的证明见补充材料B。该定理是[ 20 ]中定理5.2和[ 22]中定理3.1的改编，这两个定理研究了线性模型的选定特征上的选择性推断。请注意，定理1中的正态性假设并不意味着n个像素值服从正态分布，而是意味着每个像素值的噪声（与未知真实均值的偏差）服从正态分布。03.2. 基于GC的分割的有效p值0如§2-2中简要描述的那样，基于GC的分割是通过在有向图上求解最大流优化问题来进行的。基本上，该优化过程中的所有操作都可以分解为有向图的权重 w ( p,q )的加法、减法和比较。这表明，只要每个权重 w ( p,q )都被写成图像 x 的二次函数，GC分割算法产生分割结果 {O, B} 的事件可以完全由一组二次不等式来描述，形式为 ( 6)。接下来，我们解释如何为每条边 ( p, q ) 设置权重 w (p,q )。为了正确定义权重，需要为对象和背景区域引入种子像素。已知或高度可信的像素被设置为种子像素，分别表示为 Ose ， B se � P。种子像素可以由人工专家指定，也可以将具有最大或最小强度的像素指定为对象或背景种子像素。当两个像素节点 p,q ∈ P相邻时，根据它们的像素强度相似性和距离确定权重 w (p,q ) 。σ2bet(t∗) ≥ σ2bet(t), t ∈ {0, . . . , 255}.(8)times. The signiﬁcance level was set to α = 0.05 and the95580像素相似性通常是基于目标图像的属性来定义的。为了在选择相似性函数时提供灵活性，我们采用二次样条逼近，可以任意指定所需的相似性函数的逼近精度。例如，附录C中的图1显示了常用权重的二次样条逼近的示例 w ( p,q ) =exp( − ( x p − x q ) 2 / (2 σ 2 ))dist( p, q ) − 1 ，其中dist( p, q ) 是两个节点之间的距离。终端节点 S和一般像素节点 p ∈ P \ ( O se ∪ B se )之间的权重通常基于像素在对象区域中的负对数似然来确定。在正态性假设下，它被写为 w S,p = − log P ( x p | p ∈ O ) � log(2 πσ 2 + ( x p − m se ob ) 2 / (2 σ 2 )，其中 m se ob = �0i ∈O se x i / |O se |是对象区域中像素强度的估计值，来自对象种子像素的强度。终端节点 S和对象种子像素节点 p ∈ O se 之间的权重0应该足够大。通常确定为 w S,p = 1 + max q ∈P �0r :( q,r ) ∈N w ( q,r ) 。终端节点 S 和背景种子节点 p ∈B se 之间的权重设置为零。像素节点和终端节点 T之间的权重以相同的方式确定。由于所有边的权重都由二次方程和关于 x的二次约束表示，解决最小割（或最大流）优化问题（ 4）的所有操作都可以完全由一组二次不等式来描述，形式为( 6)。因此，可以使用PSegI框架计算基于GC分割算法得到的分割结果的有效p值。在附录C中，我们提供了用于描述基于GC分割事件所需的所有矩阵 A j ，向量 b j 和标量 c j 。03.3. 基于TH的分割的有效p值0全局和局部TH算法都适用于PSegI框架。首先，考虑全局TH算法。为简单起见，考虑从256个值 t ∈ { 0 , 1 , . . . ,255 } 中选择全局阈值 t � 的事件可以简单地写为0让 u ( t ) 和 u ( t ) 成为 n 维向量，其元素定义为0u ( t ) p = 1 if x p ≥ t, 0 otherwise; u ( t ) p = 0 ifx p ≥ t, 1 otherwise.0然后，由于区域间方差σ^2_bet(t)可以写成二次函数的形式0x��n0n(t)u(t)u(t)� + n(t0n(t)u(t)u(t)� − 2u(t)u(t)��x，0（8）中的事件可以用x上的255个二次不等式表示。此外，还需要指定像素在每个阈值t∈{0, ...,255}下是在对象区域还是背景区域。为此，考虑像素强度的顺序条件，它由一组n−1个线性不等式表示：0e�(i)x ≤ e�(i+1)x，i = 1, ..., n−1，(9)0其中(1)，(2)，...，(n)是像素ID的序列，使得x(1) ≤ x(2) ≤... ≤x(n)。由于条件（8）和（9）可以用x上的一组二次和线性不等式表示，可以使用PSegI框架计算使用全局TH算法获得的分割结果的有效p值。接下来，考虑局部阈值方法。将第p个像素分类为对象或背景区域的条件可以简单地写成对x的一组线性不等式：0xp ≥ (|Wp|−1 0q∈Wpxq)/θ � e�px ≥ |Wp|−1e�Wpx，0xp ≤ (|Wp|−1 0q∈Wpxq)/θ � e�px ≤ |Wp|−1e�Wpx，0因此，使用局部TH算法获得的分割结果的有效p值可以使用PSegI框架计算。04. 实验0我们通过数值实验验证了所提出方法的有效性。首先，我们使用人工数据评估了所提出方法的误报率（FPR）和真正率（TPR）。然后，我们将所提出的方法应用于医学图像作为实际应用。我们将假设Δ�N(0，σ^2)的朴素方法与所提出的方法进行比较，其中σ^2是基于不考虑分割偏差的分割结果计算得到的。我们将使用所提出方法和朴素方法获得的p值分别表示为selective-p和naive-p。0使用人工数据的实验。在人工数据实验中，进行了10^5次蒙特卡洛模拟。0i = 11 {pi <α}，其中pi是第i次蒙特卡洛试验的p值。数据生成范围为x∈[0,1]。最大值和最小值分别用作对象和背景区域的种子。请注意，这些种子选择被作为选择事件纳入。在FPR实验中，数据被随机生成为x�N(0.5n，0.5In×n)。02004006008000.00.20.40.60.81.0nFPR●●●●●●●02004006008000.00.20.40.60.81.0nFPR02004006008000.00.20.40.60.81.0nFPR●●●●●●●02004006008000.00.20.40.60.81.0nFPR●●proposed−FPRnaive−FPR0.00.20.40.60.81.00.00.20.40.60.81.0muTPR●●●●●●0.00.20.40.60.81.00.00.20.40.60.81.0muTPR● proposed−TPR02004006008000.00.20.40.60.81.0nFPR●●●●●●●02004006008000.00.20.40.60.81.0nFPR02004006008000.00.20.40.60.81.0nFPR●●●●●●●02004006008000.00.20.40.60.81.0nFPR●●proposed−FPRnaive−FPR0.00.20.40.60.81.00.00.20.40.60.81.0muTPR●●●●●●0.00.20.40.60.81.00.00.20.40.60.81.0muTPR● proposed−TPR95590(a) GC的FPR0(b) GC的TPR0(c) TH的FPR0(d) TH的TPR0图3：使用基于GC和TH的分割算法的人工数据实验结果。图3a和c显示了所提出方法的FPR在期望的显著性水平上得到了正确的控制。相比之下，朴素方法完全无法控制FPR。图3b和d显示了所提出的方法成功地识别出了正确的分割结果。0n = 9, 25, 100, 225, 400, 625,900。接下来，在TPR实验中，数据被随机生成为x�N(μ，0.12In×n)。这里，μ是一个包含100×100个元素的n维向量，其中大小为50×50的左上子矩阵具有均值μS，其余值具有均值μT。研究了μ=μS−μT=0.0, 0.2, ...,1.0的情况。结果如图3所示。图3a-b和c-d分别显示了基于GC和TH的分割算法的结果。如图3a和c所示，所提出的方法控制了FPR在期望的显著性水平上，而朴素方法则无法做到。朴素方法的FPR随着图像大小n的增加而增加，因为两个区域之间的均值差异增加。图3b和d显示了所提出的方法的TPR随着两个区域μ之间的差异增加而增加。0使用医学图像的实验。在本节中，我们将所提出的方法和naive方法应用于病理图像和计算机断层扫描（CT）图像。对于病理图像，采用了基于GC的分割算法来提取病理组织标本中的纤维组织区域。对病理图像的定量分析对于计算机辅助诊断非常有用。0并且提取指定区域在实践中非常重要[6, 30,39]。病理图像是通过染色了血红蛋白和嗜酸性染料的脾脏和颈淋巴结组织标本扫描获得的，扫描设备采用了AperioScanScope XT (Leica Biosystems,Germany)，玻璃载玻片以20倍放大倍率进行扫描。从扫描的全玻片图像中，手动提取了几个感兴趣区域（ROI）图像，包括有和没有纤维区域的图像，放大倍率为5倍。对上述图像应用了基于GC的分割算法，并对分割区域进行了显著性检验。方差设置为Σ = ˆ σ 2 I n × n，其中 ˆ σ 2是从独立数据中用最大似然方法估计得到的。在这个实验中，种子区域是手动选择的，但在计算 p -values时没有考虑手动选择的影响。图4和图5显示了结果。可以观察到，使用所提出的方法得到的 p -values只有在图像中实际存在纤维区域时才小于 α =0.05。相反，naive方法对于不包含纤维区域的图像始终给出零的 p-values。在CT图像的实验中，我们旨在提取肝脏中的肿瘤区域[23, 40, 1, 3, 16,28]。在实验中，我们使用了2017年MICCAI肝脏肿瘤分割挑战赛的CT图像。这里，采用了局部TH阈值分割算法来识别肝脏肿瘤区域，因为肿瘤区域的CT值低于周围器官区域的CT值。在应用局部TH算法之前，原始图像经过11×11的高斯滤波进行模糊处理。局部阈值分割的参数为窗口大小为50，θ =1.1。CT图像的局部阈值分割结果如图6和图7所示。可以观察到，使用所提出的方法（selective- p ）得到的 p-values只有在图像中实际存在肿瘤区域时才小于显著性水平 α =0.05。相反，naive方法对于不包含肿瘤区域的图像始终给出零的 p -values。05. 结论0本文中，我们提出了一种名为PSegI的新型框架，通过量化对象和背景区域之间差异的统计显著性（以 p -values的形式）来为单个分割结果提供可靠性度量。0致谢0本研究部分得到了MEXT KAKENHI 17H00758,16H06538对I.T.的支持，JST CRESTJPMJCR1502对I.T.的支持，以及RIKEN高级智能项目对I.T.的支持。95600(a) 原始0(b) 物体0(c) 背景0(naive- p = 0.00 且 selective- p = 0.00)0(d) 原始0(e) 物体0(f) 背景0(naive- p = 0.00 且 selective- p = 0.00)0图4：带有纤维区域的病理图像的分割结果。使用所提出的方法（selective- p ）得到的 p -values 小于 α =0.05，表明这些分割结果正确地识别了纤维区域。0(a) 原始0(b) 物体0(c) 背景0(naive- p = 0.00 且 selective- p = 0.35)0（d）原始0（e）对象0（f）背景0（naive-p = 0.00和selective-p = 0.73）0图5：没有纤维区域的病理图像的分割结果。使用所提出的方法（selective-p）获得的p值大于α=0.05，表明这些图像中两个区域之间的差异由于分割偏差具有欺骗性地较大。很明显，这些图像不包含特定的对象。0（a）原始0（b）模糊0（c）二值化0（naive-p = 0.00和selective-p = 0.00）0（d）原始0（e）模糊0（f）二值化0（naive-p = 0.00和selective-p = 0.00）0图6：带有肿瘤区域的CT图像的分割结果。使用所提出的方法（selective-p）获得的p值小于α=0.05。这些图像包含地面真实肿瘤区域，分割算法成功识别出来。0（a）原始0（b）模糊0（c）二值化0（naive-p = 0.00和selective-p = 0.21）0（d）原始0（e）模糊0（f）二值化0（naive-p = 0.00和selective-p = 0.77）0图7：没有肿瘤区域的CT图像的分割结果。使用所提出的方法（selective-p）获得的p值大于α=0.05。这些图像不包含任何地面真实肿瘤区域。由于分割偏差，这些图像中两个区域之间的差异具有欺骗性地较大。95610参考文献0[1] K. T. Bae，M. L. Giger，C.-T. Chen和C. E. Kahn.CT图像中肝脏结构的自动分割。《医学物理学》，20（1）：71-78，1993年。70[2] Y. Boykov和G. Funka-Lea.图割和高效的nd图像分割。《国际计算机视觉杂志》，70（2）：109-131，2006年。1, 2, 4, 50[3] Y. Boykov和M.-P. Jolly.使用图割的交互式器官分割。在《医学图像计算和计算机辅助干预国际会议》中，第276-286页。Springer，2000年。70[4] Y. Boykov和V. Kolmogorov.能量最小化中最小割/最大流算法的实验比较。《IEEE模式分析与机器智能交易》，（9）：1124-1137，2004年。40[5] Y. Y. Boykov和M.-P. Jolly.用于nd图像中对象的最佳边界和区域分割的交互式图割。在《计算机视觉第八届IEEE国际会议论文集》中，第1卷，第105-112页。IEEE，2001年。1, 2, 4, 50[6] D. Comaniciu和P. Meer.诊断病理学的细胞图像分割。第541-558页，2002年。70[7] A. Desolneux，L. Moisan和J.-M. More.一种分组原理及其四个应用。《IEEE模式分析与机器智能交易》，25（4）：508-513，2003年。20[8] A. Desolneux，L. Moisan和J.-M. Morel.有意义的对齐。《国际计算机视觉杂志》，40（1）：7-23，2000年。20[9] E. A. Dinic.具有功率估计的网络最大流问题的解决算法。在《苏联数学报告》中，第11卷，第1277-1280页，1970年。40[10] V. N. L. Duy，H. Toda，R. Sugiyama和I. Takeuchi.使用动态规划的选择性推断计算最优变点的有效p值。《arXiv预印本arXiv:2002.09132》，2020年。20[11] A. Elnakib, G. Gimelfarb, J. S. Suri, and A. El-Baz.医学图像分割：简要调查。在《多模态最先进的医学图像分割和配准方法》中，第1-39页。Springer，2011年。20[12] W. Fithian, D. Sun, and J. Taylor.模型选择后的最优推断。arXiv预印本arXiv:1410.2597，2014年。 2 , 40[13] L. R. Ford and D. R. Fulkerson.网络中的最大流。在组合数学经典论文中，第243-248页。Springer，2009年。 40[14] A. V. Goldberg and R. E. Tarjan.最大流问题的新方法。ACM期刊(JACM)，35(4):921–940，1988年。 40[15] L. Grady.随机游走图像分割。IEEE模式分析与机器智能交易，(11):1768–1783，2006年。 20[16] Y. Gu, V. Kumar, L. O. Hall, D. B. Goldgof, C.-Y. Li, R. Korn,C. Bendtsen, E. R. Velazquez, A. Dekker, H. Aerts, et al.使用单击集成分割方法自动划分CT图像中的肺肿瘤。模式识别，46(3):692–702，2013年。 70[17] T. Hershkovitch and T. Riklin-Raviv.医学图像分割的模型相关不确定性估计。在2018年0IEEE第15届生物医学成像国际研讨会(ISBI2018)，第1373-1376页。IEEE，2018年。 20[18] A. Kendall and Y. Gal.贝叶斯深度学习在计算机视觉中需要哪些不确定性？在神经信息处理系统进展中，第5574-5584页，2017年。 20[19] N. Kriegeskorte, W. K. Simmons, P. S. Bellgowan, and C. I.Baker.系统神经科学中

下载后可阅读完整内容，剩余1页未读，立即下载