没有合适的资源?快使用搜索试试~ 我知道了~
1基于基数钳位PierreBaque'1FrancoisFleuret1,2PascalFua11CVLab,EPFL,洛桑,瑞士2IDIAP,马蒂尼,瑞士{firstname.lastname}@ epfl.ch摘要平均场推论是统计物理学的核心。在计算机视觉领域中,有效地解决可表示为大型条件随机场的问题已经引起了人们的极大兴趣。然而,由于它将后验概率分布建模为边际概率的乘积,因此可能无法正确解释变量之间的重要依赖关系。因此,我们将均值场的完全因式分解分布替换为此类分布的加权混合,这类似地将KL-发散最小化到真实后验概率。通过引入两个新的思想,即条件化变量组而不是单个变量组,以及使用我们在统计物理意义上识别的温度的条件随机场势参数来选择这些变量组,我们可以有效地进行这种最小化。我们在以前的作品中提出的钳位方法的扩展,使我们既可以产生一个更描述性的近似的真实后验,并受到不同的MAP范例,适合混合的平均场近似。我们证明了这对最初依赖平均场的真实世界算法产生了积极影响。1. 介绍平均场(MF)是一种建模技术,一个世纪以来一直是统计物理学的核心。它处理涉及数百万个变量和稠密图的随机模型的能力已经引起了我们社区的广泛关注。它通常用于各种任务,如检测[14,2],分割[31,23,10,43],去噪,[11][12][13][14][15][16][17][18]估计[35]。MF通过易于编码和操作的完全分解的概率分布来近似真实分布通常在实践中通过条件随机场(CRF)定义,并且可能无法显式表示,因为它涉及变量之间复杂在这种情况下,MF AP-接近是非常有用的工具。虽然这种极端近似通常传达了感兴趣的信息,但真实分布可能集中在非常不同的配置上,同样可能,并且不能由乘积定律联合编码。第3节描述了这样一种情况,其中变量组是相关的,可能会采取一个在许多价值观与平等的概率。在这种情况下,MF将简单地选择一个有效的配置,我们称之为模式,并忽略其他配置。所谓的结构化平均场方法[32,7]可以帮助克服这种限制。这可能是有效的,但需要在每个新问题的简化子图的设计中进行任意选择,这可能是不切实际的,特别是如果初始CRF是非常密集连接的。在这里,我们介绍了一种新的方法来自动添加结构的MF近似,并显示它如何可以用来返回几个潜在的有效答案在模棱两可的情况。而不是依赖于一个单一的完全因子化的概率分布,我们引入了这样的分布,我们将称为多模态平均场(MMMF)的混合我们计算这个MMMF划分成一个标准的MF近似足够的子集的状态空间这在精神上与[39]的方法相似,但关键区别在于我们的箝位同时作用于任意大小的变量组,而不是一次一个。我们将证明,当处理具有强相关性的大型CRF时,这是必不可少的。MMMF效率的关键在于我们如何选择这些组。为此,我们引入了一个温度参数,控制我们在MF近似之前平滑原始概率分布的程度。通过对几个温度这样做,我们发现了可能在不同分布模式中采用不同标签的变量组然后,我们强制优化器通过限制它们来探索替代解决方案,也就是强制它们采用不同的值。与[39]不同,我们基于温度的方法不需要CRF结构的先验在本文的其余部分,我们将描述两个MF17261727i分发MMMF更详细。然后,我们将证明MMMF在一系列任务上优于MF和[392. 背景及相关工作条件随机场(CRF)通常用于表示变量之间的相关性[37]。平均场推理是一种以计算效率高的方式近似它们的方法我们在下面简要介绍这两种技术2.1. 条件随机场令X =(X1,. . . .. CRF通过后验概率分布将一个与另一个P(X |I)= exp(−E(X |I)− log(Z(I),(1)其中E(X|I)是一个能量函数,它是已知为势φc( ·)的 项之 和, 定义在一组图团c∈ C上,log(Z(I))是使分布归一化的对数配分函数。从现在开始,我们将省略依赖于I。2.2. 平均场推断X的所有可能配置的集合,我们用X来定义,是指数大 的 , 这 使 得 边 缘 的 显 式 计 算 , 最 大 后 验 概 率(MAP)或Z难以处理,并且已经提出了广泛的变分方法来近似P(X)[19]。其中,平均场(MF)推断是最流行的[38,33]。它涉及到引入一个分布Q,作为YNQ(X=(x1,. . .,xN))= q i(xi),(2)其中q(. )是在可能标号空间L中定义的对x i的范畴离散解。通过最小化KL-散度来估计qi问题.此外,优化器可能会陷入局部最小值。该方法通过在目标函数中引入多样性约束,依次寻找多个局部最优解,并使它们彼此不同。最近已经证明,在同一组约束条件下联合求解不同的MAP可证明更有效[20]。然而,这些方法都没有提供一个通用的和实用的方法来选择本地约束,以强制变量子组。不过,它们只返回一组地图。相比之下,我们的方法产生了后分布的多模态近似,这是一个更丰富的描述,我们将证明这是有用的。改进MF近似的另一种方法是通过将一些变量“钳位”到固定值,并为每组值找到在所得确定性条件下的最佳因子分解分布,将其分解为乘积律的混合通过对配分函数的结果近似求和,可以证明改进真实配分函数的近似[39]。然后可以通过夹紧连续变量来迭代地重复该过程,但仅适用于相对较小的CRF。在每次迭代中,基于图形模型权重选择待钳制的变量,这需要关于其内部的详细知识,而这并不总是可用的。我们自己的方法是在相同的精神,但可以钳多个变量在同一时间,而不需要任何知识的图形结构或权重。最后,DivMBest方法没有提供在不查看地面实况的情况下选择最佳解决方案的方法,除了[41]中的一种方法,该方法依赖于为此目的训练新的分类器。相比之下,我们将表明,我们的输出的多模态贝叶斯性质导致一个原则性的方法来使用时间的一致性,直接解决实际问题。KL(Q||P)=Σx∈XQ(X = x)log Q(X =x)。(三)P(X=x)3. 动机为了激励我们的方法,我们在这里提出了一个玩具的例子,说明了一个典型的故障模式的标准MF由于Q是完全因式分解的,KL-发散的项可以重新组合为期望能量的和,包含与势和每个变量包含一项的凸负熵一样多的项。然后可以使用可证明收敛的梯度下降方案进行优化[3]。正如第3节所示,这种简化有时是以淡化变量之间的依赖关系为代价的。DivMBest方法[29,4,9]从以下观察开始解决这个问题:在图模型中查找分配时,所得到的MAP不一定是最佳的,因为概率模型可能无法捕获关于技术,这是我们的设计,以防止。图1描绘了CRF,其中每个像素表示通过吸引成对势与其相邻像素连接的二进制变量。为了便于说明,我们将网格划分为四个区域,如下所示。吸引力条件在左侧较弱,但在右侧较强。类似地,在顶部,一元项倾向于值1,而在底部则完全随机。一元势在图的左上方描绘1,以及在底部的标准MF近似的结果,在像素被分配标签1的概率方面。在网格的右下角,由于相互作用势很强,所有像素最终都是1728夹紧我KK我我我我我我被MF赋予为1的高概率,这里它们也可以被赋予为零的高概率。我们在下面解释我们的MMMF算法如何能够产生两个同等可能的模式,一个模式具有高概率的所有像素为零,另一个模式具有高概率的所有为了实现这一点,将Qk分布的支持约束为不相交的,即,kk′,Q k′(Xk)=0。(5)换句话说,每个MF近似都专门针对输入既往偏向1弱配对强配对熵降状态空间的子集Xk,并且被计算以最小化KL分歧在那里。在实践中,我们通过递归地将一组状态Xk拆分为分区X,. . . ,X分成两个子集X1和X2,以获得1Kk k之前新分区X1,. . . ,Xk−1,X1,X2,Xk+1,. . . ,XK,不是k k偏置MF MMMF然后从1到K+1重新索引。最初,Xk表示-发送整个状态空间。那我们就把它当成以宽度优先的顺序创建子集,直到已经达到预设数量的子集。每一次,该算法通过以下步骤进行:• 它查找可能具有不同值的变量组图1.MMMF解决了MF的典型故障模式灰度表示在先验(输入)和乘积定律(MF和MMMF)下的边际概率。4. 多模态平均场给定一个相对于图形模型定义的CRF和X中所有状态的概率P(X=x),2.1节中介绍的状态空间,标准MF近似仅对P的单个模式建模,如前所述在不同的分布模式中使用熵-基于qk的标准。• 它根据一个子句将集合划分为两个不相交的子集,该子句为该组中采用特定标签的变量的数量设置阈值 X1将包含Xk中满足此子句的状态,X2将包含其他状态。• 它在每个子集内独立地执行MF近似,以计算参数qk,1和qk,2,第2.2节。因此,我们建议创建一个更丰富的表示,占潜在的多个模式,通过替换方程的完全分解的分布。2通过这样的分布的加权混合,更好地最小化KL发散到P。潜在的障碍是最小化问题的难度增加。在本节中,我们将概述解决该问题的方法,并在以下两个方面讨论其关键方面。形式上,让我们假设我们已经将X划分为不相交的子集Xk,其中1≤k≤K。我们用以下形式Σ每一个人这是由一个标准的MF近似完成的信息,其中我们添加了不相交约束5。这产生了一个二叉树,其叶子是形成所需状态空间分区的Xk在这种情况下,我们最终可以评估mk。在第5节中,我们介绍-我们的基数为基础的标准,并表明它使KL-发散最小化的可能性。在第6节中,我们展示了我们的基于熵的准则如何在每次迭代中选择子句所依赖的变量组。5. 划分状态空间P(X=x)<$ QMM(X=x)=Qk(x)=mk Qk(x),(4)KYqk(xi),我在本节中,我们描述了用于递归分裂状态空间的基于基数的标准,并解释了为什么它允许KL-发散KL(QMM)的有效优化,其中QMM是等式的混合。4.第一章其中Q k是状态x ∈ Xk的MF近似,其中变量i可以在标签集合L中取值x i的概率为q k,m k是状态属于X k的概率。我们可以通过最小化来计算mk和qk值,QMM与P.使这种计算易于处理的关键是保证我们可以通过对每个子集执行标准MF近似来分别评估每个子集上的qk参数。 一种方式5.1. 基于基数的箝位上面介绍的状态空间划分Xk,1≤k≤K是我们近似及其质量的核心,它的易处理性主要取决于选择得如何。在[39]中,每个分裂都是通过将单个二进制变量的值箝位为零或一来获得的。换句话说,给定一组要分裂的状态Xk,它被分解为子集X1={x∈Xk|xi=0}和X2={x∈Xk|x i= 1},K K1729我KKQ我我其中i是特定变量的索引。为了在这些子空间中的每一个上计算P的平均场近似出现在Eq。4.第一章我们将它们计算为Σ ΣQ(x),只需要执行标准平均场近似,最小KL(QMMP)=最小mkQk(x)log MM信息,同时约束Qi概率分配给m,qm≠,q≠x∈Xk≤KΣP(x)Σ被钳制的变量为零或一。但这限制了实践中使用的大型和密集CRF拉斯敏mk≤Kmklog(mk)−k≤K(9)第一次见面。因为一次仅箝位多个变量中的一个变量可能对整体影响很小。推动解决方案其中,Ak =MaxKΣQk(x)logE(x),Q(x)(十)朝向对应于不同模式的性质上不同的最小值可能需要同时箝位许多变量。为了弥补这一点,我们保留钳位的想法,但它适用于组的变量,而不是个别的,以便找到新的模式后,同时保持估计的参数mk和qk计算上容易处理。更具体地说,给定一组要分裂的状态Xk,我们将说X1和X2的分裂是基于基数的,如果qi,i=1. Nx∈Xk其中Ak在Eq的近不相交约束下最大化。8.正如证明正式补充材料,第二个平等的方程式。9是有效的,直到一个常数,并在忽略一个项的顺序O(log)下出现的近不相交假设的支持。给出等式的Ak10.在混合物的限制下,真概率之和为1,我们必须K K阿凯X1={x ∈ Xks.t.u =1. LΣ(xiu =v(u)≥C},(6)mk=m,(11)eAk′k′≤KX2={x ∈ Xks.t.n(xiu=v u) h高][H(q1)Tc。否则,我们根据经验在一个小的验证集上选择Tmax,并在测试期间固定它7.1. 合成数据为了证明我们的方法比标准MF和[39]的箝位方法更好地最小化KL-散度,我们使用相同的实验协议来生成具有随机权重的条件随机场[13,40,39]。然后,我们的任务是找到MMMF近似与最低KL发散的任何给定数量的节点。当这个数为1时,它就简化为MF。请注意,[39]的作者寻找对数配分函数的近似值,这与最小化KL散度严格相同,如补充材料中所因为它涉及随机选择的正权重和负权重,所以这个问题有效地模拟了现实世界中具有排斥项、不受控制的循环和强相关性的困难问题。在图2中,我们绘制了KL发散度作为用于近似标准基准分布的模式数量的函数。这些模式是使用第6节中描述的基于熵的标准或[39]中的MaxW标准获得的,我们将其称为在图2中,我们绘制了L=1和L=3,在100个实例上评估。在大多数情况下,OURS-RANDOM的性能优于BASELINE-MAXW方法,即使它不使用CRF内部的任何知识,而OURS-MAXW的性能甚至更好。在13×13网格上的结果表明,当CRF变得更大。7.2. 多模态概率职业地图概率占用地图(POM)方法[14]依赖于行人检测的平均场推断。更具体地,给定具有离散化地平面的重叠视场的若干相机,该算法首先执行背景减除。然后,它估计在每个离散位置的占用概率作为乘积律的边缘,最小化KL偏离1、定义能量函数。它的值是通过使用生成模型计算的:它把人表现为简单的圆柱体,在各种图像中投射到矩形上。给定在不同位置处的人的存在或不存在的概率和已知的相机模型,这产生合成图像,其与对应的背景减除图像的接近度被测量并用于定义能量。该算法通常是非常鲁棒的,但是当背景减除图像的多个解释是可能的时,该算法可能失败。这源于标准MF近似的有限建模能力,如柔性材料中所示我们在这里表明,在这种情况下,替换MF的MMMF,同时保留框架的其余部分产生多种解释,其中正确的一个通常是要找到的。图3描述了当我们用MMMF代替MF来近似真实的后验,而不改变算法的其他内容时会发生什么。为了生成第5节的二叉树的新分支,我们找到潜在的变量来进行箝位,如第6节所述。 其中,我们夹熵差最大的那个-H(qT)− H(q1),us-我我基线-最大值它包括顺序地夹紧具有对的绝对值的最大和的变量明智的潜力,边缘连接到它的邻居。它被证明是其他几种方法中最好的方法之一,这些方法的表现大致相似。在我们的实验中,我们使用第6节的相变准则来选择要箝位的候选变量。然后,我们随机选择L变量组进行箝位,或者使用[39]的MaxW准则选择最佳L变量。我 们 将 第 一 个 称 为 OURS-RANDOM , 第 二 个 称 为OURS-MAXW。最后,在所有情况下,C=L,并且值vu对应于模式分割的MAP所取的值。使用Eq.15-和它的邻居在网格上当评估基数约束时,我们将C取为1,这意味着树的一个分支对应于所选位置的邻域中没有人,而另一个分支对应于该邻域中至少有一个人。 由于我们通常通过DIS创建这些位置-将地平面划分为10cm×10cm的网格单元,这迫使两个新实例化的模式具有重要意义。与以几厘米的位移为特征的相同检测相反,有着明显的不同。在图3中,我们将结果绘制为虚线曲线,表示MODA分数作为用于计算它们的距离阈值的函数[6]。在所有情况下,我们使用4种模式进行MMMF近似,1733OURS-RANDOM组大小1OURS-RANDOM组大小3OURS-MAXW组大小1 OURS-MAXW组大小3基线-MAXW基线-随机OURS-RANDOM组大小1OURS-RANDOM组大小3OURS-MAXW组大小1 OURS-MAXW组大小3基线-MAXW基线-随机OURS-RANDOM组大小1OURS-RANDOM组大小3OURS-MAXW组大小1 OURS-MAXW组大小3基线-MAXW基线-随机OURS-RANDOM组大小1OURS-RANDOM组大小3OURS-MAXW组大小1 OURS-MAXW组大小3基线-MAXW基线-随机OURS-RANDOM组大小1OURS-RANDOM组大小3OURS-MAXW组大小1 OURS-MAXW组大小3基线-MAXW基线-随机KL-发散 *KL-发散 *KL-发散 *KL-发散 *KL-发散 *15克N = 78ga N =715rm N =75例,N = 74610 103425 52100124816326412800124816326412800124816326412800124816326412880克N = 1330ga N =13480rm N = 1320例,N = 1346070 152544060 104202050 54004001248163264128150124816326412838001248163264128001248163264128混合网格吸引网格混合随机吸引随机图2. 使用我们的夹紧方法或[39]的方法的KL发散平均超过100次试验。垂直条代表标准差。吸引意味着成对项是从[0,6]均匀地得出的,而排斥意味着从[−6,6]得出。Grid表示CRF的网格拓扑,而Random表示连接是随机选择的,因此连接数与网格中的连接数一样多。我们使用7×7和13 ×13变量CRF进行了实验。遵循DivMBest评估度量[4],通过在对应于每个模式的4个检测图中选择产生最高MODA分数的检测图来产生分数。这将产生系统性地高于蓝色虚线MF的红色虚线MMMF曲线。然而,要将这种改进变成一种实用的技术,我们需要一种方法来在4种可能的解释中进行选择,我们使用时间的一致性,共同找到最好的模式序列,并从这个序列重建轨迹。在原始算法中,在连续时刻计算的POM用于使用K-最短路径(KSP)算法产生一致的轨迹[5]。这涉及构建一个图,其中每个时间步处的每个地面位置对应于一个节点,并且连续时间步处的相邻位置被连接。然后KSP在这个图中找到一组节点不相交的最短路径,其中通过位置的成本与POM中位置的负对数概率成比例[34]。由于MMMF产生多个POM,因此我们在这个新的图中解决了多个最短路径问题,并且在每个时间步长处,所有路径必须经过对应于相同模式的节点的副本的附加约束,如补充材料中更详细地描述的。图中的蓝色实线。图3描绘了使用KSP时的MODA分数,红色的是多模态版本,我们将其标记为KSP。MMMF曲线再次高于MF曲线。这是有道理的,因为模糊的情况很少持续超过几帧。因此,强制执行时间一致性消除了它们。7.3. 多模态语义分割基于CRF的语义分割是MF推理在计算机视觉中最著名的应用之一,图3. 在POM算法中用MMMF代替MF [14]。蓝色曲线是使用MF获得的MODA评分[6],红色曲线是使用MMMF获得的评分它们在强制时间一致性时显示为实线注意,在所有情况下,红色MMMF线都在相应的蓝色MF线之上。(a)使用单个相机从MVL 5 [26(b)使用两个相机从Terrace数据集[5]中提取400帧(c)使用单个相机的80帧EPFL-Lab数据集[5]。(d)使用两台相机从EPFL-Lab数据集[5pose.我们在这里证明,我们的MMMF近似可以增强Pascal VOC 2012分割数据集和MPI视频分割数据集[16]上的两种最新算法[10,42单个VOC图像我们将后验写成[10]的CRF,我们试图近似。为了创建第5节的二叉树的分支,我们首先找到要箝位的潜在变量,如第6节所述。与7.2一样,我们在滑动窗口中选择最大熵差,H(qT)− H(q1)。 然后,我们将C我我最近的算法依赖于密集CRFOURS-RANDOM组大小1OURS-RANDOM组大小3OURS-MAXW组大小1 OURS-MAXW组大小3基线-MAXW基线-随机OURS-RANDOM组大小1OURS-RANDOM组大小3OURS-MAXW组大小1 OURS-MAXW组大小3基线-MAXW基线-随机OURS-RANDOM组大小1OURS-RANDOM组大小3OURS-MAXW组大小1 OURS-MAXW组大小3基线-MAXW基线-随机KL-发散 *KL-发散 *KL-发散 *1734我们在所选择的变量中寻找主导标签,并将状态空间分成这些变量中超过一半采用该值的那些和其中少于一半采用该值的那些。(a)(b)第(1)款(c)(d)其他事项图4.定性语义分割 (a)原始图像。(b) 熵 差 。 ( c ) MF 近 似 后 具 有 最 大 后 验 概 率 的 标 签(d)MMMF近似最佳模式的最大后验概率标签。图4示出了VOC数据集的图像上的结果。为了定量评估这些结果,我们首先使用DivMBest度量[4],如我们在7.2节中所做的那样。我们有一个预言机,可以通过查看地面实况来选择我们的多模态近似的最佳模式。图5(a)描绘了VOC 2012 Pascal数据集的验证集上的结果,其关于作为模式数量的函数的平均交集大于并集(IU)得分。当仅使用1个模式时,结果归结为标准MF推断,如[10]中所示。使用32产生2。比MF近似值提高5%这似乎很小,直到一个人认为,我们只修改了阿尔租姆在[10,43]中,该发动机已被证明对整体性能的贡献约为3%,这意味着我们几乎将其效率提高了一倍。出于分析目的,我们实施了两个基线:• 而不是钳制变量组,我们只钳制变量与最大熵差距在每一步。如图中的红色曲线所示5(a)、这绝对没有影响,并且说明了夹紧变量组而不是如[39]中的单个变量的重要性。• DivMBest方法[4]首先计算MAP,然后向能量函数添加惩罚项以找到与第一个不同的另一个MAP然后,它重新-这是一个过程。我们采用这种方法的MF推理。图中的绿色曲线。5(a)描述了结果,MMMF优于1。百分之五方法IUMF百分之四十四点九[39]第三十九话百分之四十四点九(a)( b ) 第(1)款图5.定量语义分割(a)VOC 2012。最佳模式的IU分数是模式数量的函数MMMF为蓝色,基线为红色和绿色。(b)MPI数据集[16]。语义视频分割。我们使用[42]的CRF对MPI视频分割数据集[16]的图像进行了相同的实验。在这种情况下,我们可以利用时间一致性来避免必须使用一个或-acle,并且仍然得到一个可利用的结果,正如我们在7.2节中所做的那样。此外,我们可以做到这一点,尽管相对较低的帧速率约1Hz。更具体地说,我们首先基于匹配关键点的标签概率定义连续模式之间的兼容性度量,我们使用关键点匹配算法[30]计算该匹配关键点的标签概率然后,我们计算一个最短路径的模式序列,考虑到个别模式的概率由方程。11个国家。最后,我们只使用最短路径算法选择的模式对应的MAP来产生分割。在图5(b)中,我们再次报告了IU评分的结果。这一次的改善是在2左右。4%,这表明施加时间一致性非常显著地改善了推理的质量据我们所知,其他现有技术的视频语义分割方法不适用于这样的图像序列。[17]需要非移动场景和超像素分解,这阻止使用所有基于密集CRF的图像分割器。[24]仅应用于街景,并且需要更高的帧速率来提供准确的流量估计。8. 结论我们已经表明,我们的MMMF方法使它成为可能,以增加结构的标准MF近似CRFs和提高性能的算法,依赖于它。实际上,我们的算法创建了几个交替的MF近似值,并为其分配了概率,这有效地模拟了可能有多个解释的复杂情况。由于MF最近已通过后均值场过程[12,25,43,1]集成到结构化学习架构中,因此未来的工作将旨在在此背景下用MMMF取代MF。这项工作得到了瑞士国家科学基金会的部分支持1735引用[1] A. Arnab,S.Jayasumana,S.Zheng,和P.H. S. 乇端到端可 训 练 条 件 随 机 域 中 的 高 阶 势 。 CoRR ,abs/1511.08119,2015年。四、八[2] T. Bagautdinov,P. Fua和F.弗勒特遮挡深度图像的概率遮挡图。在计算机视觉和模式识别会议上,2015。1[3] P. Baque,T. Bagautdinov,F. Fleuret,和P.呸离散随机场的平行平均场原理推断。计算机视觉与模式识别会议,2016年。2[4] D.巴特拉P.亚多拉普尔,A.古兹曼-里韦拉,和G.沙赫纳洛维奇马尔可夫随机场中的多样M-最佳解在European Conference on Computer Vi-sion,第1-16页,2012年。二七八[5] J. Berclaz,F. Fleuret,E. Tuéret k en和P. 呸基于K-最短路径优化的多目标IEEE Transactions on Pattern Analysisand Machine Intelligence , 33 ( 11 ) : 1806-1819 ,2011。7[6] K. Bernardin和R. Stiefelhagen 评估多目标跟踪性能:清 雾 号 EURASIPJournalonImageandVideoProcessing,2008,2008。六、七[7] A. Bouchard-C ot e'和M. I. 约旦. 结构平均场目标的优化在第二十五届人工智能不确定性会议论文集,UAI北京大学出版社. 1[8] S. Boyd 和 L. 范 登伯 格 凸 优化 。 剑桥 大 学 出版 社 ,2004。4[9] C. Chen,V. Kolmogorov,Y. Zhu,D. Metaxas和C. 令人讨厌。计算图形模型的M个最可能模式Journal ofMachine Learning Research,2013。2[10] L- C. Chen,G.帕潘德里欧岛科基诺斯角墨菲和A.尤尔。使用深度卷积网络和全连接CRF的语义图像分割。在2015年国际学习代表会议上。一、六、七、八[11] W. 周,S。Kim,S.Park和J。公园平均场退火EM图像分割。图像处理,2000年。诉讼 2000年国际会议,第568- 5713页,2000年。1[12] J·多姆克用近似边缘推理学习图模型参数。CoRR,abs/1301.3193,2013年。8[13] F. Eaton和Z. Ghahrmani选择要钳制的变量:使用条件信念传播的近似推理。2009年,人工智能与统计国际会议。6[14] F.作者:J. Lengagne和P.呸基于概率占用图的多摄像机人群 跟踪 。IEEE Transactions on Pattern Analysis andMachine Intelligence , 30 ( 2 ) : 267-282 , February2008. 一、四、六、七[15] R.弗朗森斯角Strecha和L.范古尔地图估计中相干遮挡处理的平均场EM算法。计算机视觉与模式识别会议,2006年。1[16] F. 加 拉 索 河 Nagaraja , T.Cardenas , T.Brox , and B.Schiele.统一的视频分割基准:注释、检索和分析。在2013年12月的计算机视觉国际会议上。七、八[17] J. Hur和S.罗斯联合光流和时间一致的语义分割。CoRR,abs/1607.07716,2016。8[18] L. P. 卡丹诺夫更多的是相同的;相变和平均场理论。Journal of Statistical Physics,137(5):777,2009. 5[19]J. H. 卡佩斯湾Andres,F. A. 汉普雷希特角Schnor?r,S. No wozin、D. 巴特拉、S. 金湾,澳-地X. Kausle r,T. Kroéger,J. Lellmann等人结构化离散能量最小化问题现代推理技术 的 比 较 研 究 。 International Journal of ComputerVision,115(2):155-184,2015. 2[20] A. 基里洛夫湾Savchynskyy,D.Schlesinger,D.维特罗夫,C.罗瑟在单个标签中推断M-最佳多样标签。国际计算机视觉会议,第1814-1822页,2015年2[21] P. Kohli和C.罗瑟计算机视觉中的高阶模型。号手术Lezoray和L.Grady,编辑,图像处理和图形分析,第65-100页CRC Press,2012. 4[22] D. Koller和N.弗里德曼概率图形模型。MIT Press,2009. 1[23] P. K raühenbuühl和V. 科尔顿稠密随机场的并行学习与收敛推理国际机器学习会议,第513-521页,2013年一、五、七[24] A. 昆杜河谷Vineet和V.科尔顿。语义视频分割的特征空间在计算机视觉和模式识别会议上,第1-8页8[25] Y. Li和R. S.泽梅尔平均场网络在2014年国际机器学习会议上。1、8[26] R. Mandeljc,S. K. M. Kristan和J. Pers.使用计算机视觉和无线电识别跟踪。传感器,2012年。7[27] S.诺沃津角Rother,S. Bagon,T.夏普湾姚和P. Kholi.决策树字段。在2011年11月的国际计算机视觉会议上。1[28] E. Premachandran,D.Tarlow和D.巴特拉 经验最小贝叶斯风险预测:如何吸引男人视觉模型的%性能,只需三个参数。计算机视觉与模式识别会议,2014年6月。5[29] V. Ramakrishna和D.巴特拉边缘模态:通过不同的M-Best解决方案表达不确定性。神经信息处理系统进展,2
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Aspose资源包:转PDF无水印学习工具
- Go语言控制台输入输出操作教程
- 红外遥控报警器原理及应用详解下载
- 控制卷筒纸侧面位置的先进装置技术解析
- 易语言加解密例程源码详解与实践
- SpringMVC客户管理系统:Hibernate与Bootstrap集成实践
- 深入理解JavaScript Set与WeakSet的使用
- 深入解析接收存储及发送装置的广播技术方法
- zyString模块1.0源码公开-易语言编程利器
- Android记分板UI设计:SimpleScoreboard的简洁与高效
- 量子网格列设置存储组件:开源解决方案
- 全面技术源码合集:CcVita Php Check v1.1
- 中军创易语言抢购软件:付款功能解析
- Python手动实现图像滤波教程
- MATLAB源代码实现基于DFT的量子传输分析
- 开源程序Hukoch.exe:简化食谱管理与导入功能
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功