没有合适的资源?快使用搜索试试~ 我知道了~
1在线图表完成:计算机视觉中的多变量信号恢复Won Hwa Kim<$,Mona Jalal<$,Seongjae Hwang<$,Sterling C.Johnson,VikasSingh§,††部门美国威斯康星大学麦迪逊分校计算机科学系§部门生物统计学和医学信息学,美国威廉·格雷奇Middleton VA Hospital,Madison,WI,美国http://pages.cs.wisc.edu/www.example.com摘要在计算机视觉和机器学习中采用人类监督)和底层推理算法紧密交织。当学习模块涉及分类和回归任务时,主动学习中的经典工作提供了有效的解决方案,但许多实际问题,如部分观察到的测量,财务约束,甚至数据的其他分布或结构方面,通常都不属于这种处理的范围。例如,随着对表现为矩阵(或tensor)的数据的部分测量的出于视觉问题,我们寻求通过众包平台或替代地,补充来自使用人类反馈的最先进的对象检测器的结果来标注大型图像数据集,我们研究了定义在图上的我们在图的傅立叶域中设计了优化模型,描述了基于自适应子模块的思想如何提供在实践中工作良好的算法。在从Imgur收集的大量图像中,我们看到了很有希望的结果,这些图像很难分类。我们还展示了神经影像学中的实验设计问题的应用1. 介绍缺失或部分观察到的数据问题在科学中无处不在-这个问题在现代计算机视觉和机器学习的翻译/操作方面变得更加相关有时,由于预算限制,我们可能会受到每个参与者在其他情况下,由于逻辑原因,特征/响应的子集(或甚至大部分)可能在数据的一部分设备故障,人为疏忽或故障-在数据采集中常见的噪声、噪声和其他因素导致要分析的数据的子集丢失、部分被观察到或系统地被破坏的情况有时,这种现象可能是前瞻性的-一种设计选择,其中实验可以仅对少数样品进行广泛的或者,它可能是必须以追溯的方式考虑的一种损害(例如,10%的参与者只标记了图像中一半的物体)。随着部署在现实世界中的计算机视觉和机器学习系统的数量持续增长,并且“人在回路中”范例成为主流,这些问题将作为一阶约束出现,应该为算法的设计提供例1. 我们的任务是通过众包平台收集100多万张图像上的人类注释。不幸的是,分配的预算仅够用于500K图像注释。假设语料库中的250K随机选择的图像已经在第一阶段中被注释。我们可能会问一个有趣的问题:基于所计算的图像特征(例如,使用深度网络[33,36,17]),如果我们只能基于财务约束获取部分数据,我们能否提出一个一个“命令”的要求(政策)比另一个更好吗?如果我们知道我们将使用注释运行一个简单的逻辑回归,那么数据的哪些属性将确保我们在下游机器学习模型上获得保证?实施例2. 考虑我们可以访问(已经训练好的)模型进行对象检测的设置。当我们在通过Reddit或Imgur等平台获得的图像上使用该系统时,它运行良好,但对于η%的图像失败。让我们假设已经学习的系统提供了良好的特异性,即,当模型高度可信时,其预测与地面实况标签相关。另外,我们还有辅助信息(例如,注释、与每个图像相关联的标题)。虽然并不完美,但这种辅助数据提供了图像之间的某种关联如果这是一个部分观测分布(缺失观测值的η%),我们能否提供新的对象35683569在图像上,现有技术的对象检测器失效的概率?现在,如果人类监督可以注释图像的一小部分,η%,我们会要求人类干预图像的哪个顺序?将对象概率视为多变量实施例3. 在神经影像学研究中,我们可以被提供一组相对便宜的测量(例如,MRI扫描)。让我们假设这些测量与更昂贵和高信息量的采集(例如PET扫描)相关;从较便宜的扫描获得的总结是有用的,但具有较高的可变性[35]。从这组更便宜的成像测量数据统计这些信息如何指导在预算有限的情况下收集剩余参与者的更昂贵数据我们能保证下游模型的统计能力会提高吗?如果我们忽略上述问题的在线方面,那么通过矩阵完成的镜头来考虑上面的示例1到3是合理的[10,5,6,37,6,4,16]。实际上,每个主体/参与者可以作为矩阵中的一列给出,该矩阵被部分观察(可能被破坏),并且任务是然而,我们看到,即使是在低秩矩阵复杂的入门级的假设被违反,例如,受限制的等距性(RIP)和非相干采样。直接对该问题求解的鞋拔矩阵完备化方法会产生不满意的结果,我们稍后将对此进行描述.图形表示。与矩阵相比,用图来表示数据可能更自然。独立参与者是节点,并且他们的测量可以被假设为在每个节点上观察到的维度为p的多变量信号如果我们假设一些辅助信息产生这些节点之间的关联,那么部分观察设置模拟了在某些节点上我们根本没有观察到信号的情况,见图21.一、这个“离散”空间(即,图)版本的完成问题只是在过去两年中才被研究/形式化。在[28]中,协同过滤的思想被推广到图中,其中使用图的拉普拉斯算子来另外,在[27]中引入了带限假设的随机采样方案,其中作者通过分析图的拉普拉斯算子的特征值/特征向量来定义图的每个节点处的采样概率分布。这些方法基本上模拟了图的完成问题(图中展示的一个例子)。1)通过将观察到的测量传播到其相邻顶点(其中测量未被观察到)来使用扩散过程。他们利用图的拉普拉斯算子的谱来模拟原生空间中的扩散过程图1:Armadillo网格上的图形完成示例,给定基于曲率的边权重。左:网格上的噪声信号,中:对信号的部分观察,右:网状物上信号的恢复。(i.e.、图),并在图空间中求解优化问题以获得最优解。这些都是重要的结果,为我们的实验提供了基线关键思想。我们提出的算法的出发点是对给定的图进行谐波分析。类似于回想一下,测量/信号在其图形空间中表示为平滑函数,但其在对偶空间中的表示可能是稀疏的,这是频率分析的重要优势[20]。我们利用类似的想法,在图形设置中使用图形傅立叶变换。完成问题的当我们在一个顶点上获得一个测量值时,剩余的未观察到的顶点集的这种策略与收益递减的思想有关,但却是一种“适应性”的变化。虽然已经针对一般矩阵或张量设置研究了这种在线sce- nario [21,22,25],但没有算法可用于图形。我们展示了如何最近的工作子模最大化可以适应分析的测量图在这个在线的方式利用图形傅立叶表示。在本文中,我们提供了一个框架,决定最佳的策略选择顶点的图上的一个准确和有效的恢复信号,通过探索其对偶表示。本文的贡献是:1)提出了一种利用自适应子模块度顺序选择图顶点的算法; 2)提出了一种利用图傅立叶变换顺序恢复图顶点上信号的算法;3)在大规模图像数据集和神经成像数据集上证明了广泛的结果。在图像数据上,我们估计图像上的对象标签,其中最先进的对象检测器失败。在神经成像数据上,我们使用其他更便宜的测量方法来估计来自大脑扫描的昂贵的2. 背景:非欧空间傅立叶变换和小波变换几乎完全是在欧氏空间中被广泛研究的。最近,几个小组已经证明了这些变换在非欧几里德空间中的类似物[8,14],它们是3570LLSs这是我们提出的算法的基础。因此,我们在本节中提供简要说明。2.1. 傅立叶变换和小波变换傅里叶变换将x中的信号f(x)变换为使用sin()基函数在频率空间ω中的fω(ω),f<$(ω)=<$f,ejωx<$$>=<$f(x)e−jωxdx. 根据R-小波变换是类似的但是它利用局部化振荡基函数(即,母小波)进行变换。虽然傅立叶基具有无限支撑,但小波变换在时间和频率空间中都是局部化的[26]。一个尺度为s、平移为a的母小波可以写为αs,a(x)=1α s(x−a),其中改变s和a会分别改变αs,a的伸缩和位置使用αs,a作为基,函数f(x)的小波变换产生小波系数Wf(s,a),定义为:∫W(s,a)= 1f,1f=1 f(x)1f(x−a)dx(1)谱图理论[7]的正交基和设计一个g()在空间所跨越的基地。一般来说,图G={V,E}由一组大小为N的顶点V和一组连接顶点的边E表示邻接矩阵AN×N是表示图G的最常用的方法,其中每个元素aij表示E中第i个顶点和第j个顶点之间通过相应的边权的连接。另一个矩阵,度矩阵DN×N,是一个对角矩阵,其中第i个对角元素是连接到第i个从这两个矩阵,一个图拉普拉斯算子被定义为L=D−A。注意,L是自伴和半正定算子,因此提供了成对的特征值λl≥0和对应的特征向量χl,l=1,···,N,它们彼此正交。基χ可以用于定义在顶点n上定义的函数f(n)的图形傅里叶变换,如下所示:fs sΣNΣN其中,π是π的复共轭。在频率空间中,滤波器表现为带通滤波器f(l)=f(n)×n(n)和f(n)=n=1l=1f(l)xl(n)(2)覆盖对应于尺度S的不同带宽。当这些带通滤波器不处理低频带时,缩放函数φ(即,低通滤波器)。最后,f与尺度函数φ的变换导致原始信号的平滑表示,并且在母小波的多个尺度s上的滤波提供了给定信号的多分辨率视图。在傅立叶变换和小波变换的两种情况下,存在使用其系数和基函数重构原始信号f(x2.2. 图的傅立叶变换和小波变换欧氏空间通常表示为规则格,因此可以容易地构造具有特定形状的母小波来定义小波变换。另一方面,在通常由一组顶点和它们的任意连接表示的非欧几里德空间中,母小波的构造是不明确的,这是由于子小波a的伸缩和平移的定义。由于这些问题,经典的傅立叶/小波变换一直不适合分析复杂空间中的数据,直到最近[14,8]才提出了这些图的变换。构造母小波的核心思想是在图的节点上的频率来自其在频率空间中的表示。通过在频率空间构造不同形状的带通滤波器,并将其变换回原始空间,可以实现保持小波传统性质的这样的实现需要一组“标准正交”基和一个核(滤波器)函数。标准正交基跨越非欧几里德设置中的频率空间的模拟,并且核函数表示频率空间中的子空间的表示在这个意义上,当非欧空间表示为图时,我们可以采用其中,X是X的共轭。这里,通过正变换获得图形傅里叶系数f(l),并且可以通过逆变换重建原始函数f(n)。 如果信号f(n)存在于前k个特征向量的谱中,我们说f(n)是k-带限的。这种变换提供了一种在对偶空间中查看定义在图顶点上的信号的方法,该对偶空间是傅立叶变换中的频率空间的模拟然后可以使用图形傅里叶变换来定义母小波变换首先,核函数g:R+→R+(即,带通滤波器)在对偶空间中设计,则该操作由顶点n处的冲激函数δn局部化:ΣNn(m)=g(sλ l)×n(n)× l(m)。 (三)l=1这里,尺度参数s与χ无关,并且使用傅立叶变换的缩放特性在g()内部定义[32]。网格上的局部化网格的例子如图所示。2与χ3比较(非局限性)。函数f(n)在图顶点n上的尺度s的小波变换然后可以使用在(3)中定义的基来写,并且它遵循小波变换的常规定义,从而产生尺度s和位置n的小波系数Wf(s,n)为ΣNW f(s,n)= gf,n s,nn n =g(sλ l)fλ l(l)× l(n).(四)l=1该变换提供了在图顶点上定义的信号的多分辨率视图,就像欧几里得空间中的传统小波变换一样(例如,像素)。我们的方法将很快介绍将使用图形傅立叶变换和小波图正式化自适应顶点选择策略和图形完成。3571ℓ2ℓ2l=1KL图2:狗形网格上的基函数示例。左:χ3(未定位),中:在背部和爪上的两个χ1(定位),右:χ5(定位和浓缩)。3. 我们所提出的算法考虑一种设置,其中存在定义在N个图顶点上的p个特征的未知带限信号f可以用几个sin()函数来重建原始域中的信号。图像空间中的信号在空间上接近的像素之间趋于平滑,另一方面,它们的频率表示与这种空间约束无关[20]。这种观察对于信号/测量的低秩估计方法至关重要,并且已在机器学习和计算机视觉文献中使用[6,4]。在这种情况下,我们希望得到一个有限带宽的解决方案,是稀疏的范围内的k带。将(6)变换到由Uk所张成的空间中,并对稀疏性施加n-1-范数约束,我们得到(in相同的状态空间)。 换句话说,在每个顶点原则上我们可以得到一个p维特征。怎么-ZZ=argmin||PUkZ−Y||2Z∈Rk×p公司简介||Z||ℓ1(七)在现实中,我们可能只能观察到信号在图的m<$N个不同顶点处,由于预算约束。在这种情况下,我们可能会问两个与所有顶点处的信号f的恢复相关的核心问题:1)如何有效地恢复每个顶点上的信号,以及2)如何选择最佳的m个顶点(以及以何种顺序)来获取额外的测量值。我们解决这些问题,制定了自适应的子模函数从图的频率空间我们提供了我们的解决方案,这两个问题表明,我们的公式是自适应次模,并提出了一种算法来恢复完整的信号。注意与经典主动学习的区别(也见[20,21,22]),我们的规范对后续任务是不可知的(例如,分类)。3.1. 图傅里叶空间中的信号恢复假设我们从一个全(未知)函数f∈RN×p的m个顶点Y∈Rm×p上收集了数据。这里,我们的目标是基于部分观测值Y恢复原始信号f。我们将所选择的索引的集合表示为W={w1,w2,...,wm},并且定义将f映射到Y的投影矩阵P(即,Pf=Y):.1,如果j=wi其中,稀疏度控制稀疏度,并且使用LASSO求解器[34]可以轻松获得其解。这里的最优解Z是原始信号f在频率空间中的稀疏编码的估计,并且其在原始空间中的表示可以通过执行逆图形傅立叶变换来经验地恢复为Z(n)=kZ∈N(l)x(n). 注意,在(7)中,我们避免了im-提出了已在其他方法中使用的平滑约束[28,27],因为我们的解决方案由于其低秩和带限特性而已经是平滑的。然而,当我们假设(即,稀疏性)在对偶域中不成立。3.2. 执行顶点为了使我们的信号恢复过程获得可能的最佳估计,构造投影矩阵P的顶点的最佳顺序选择是至关重要的。对于这个任务,我们从自适应子模块的角度来处理这个问题。让我们首先澄清一些符号来描述自适应子模块。给定一个具有可能状态S的顶点集V,我们定义一个函数γ:V→S作为一个实现。 我们还将Γ表示为具有先验概率的随机实现Pi,j=.(五)0o.w.p(γ):= P [r=γ]。 在这种情况下,我们寻找一个战略-egy选择一个顶点v,观察它的状态Γ(v),然后选择基于来自所选数据点的数据Y(即,顶点),朴素的信号恢复算法可以解决Z= arg min||PZ-Y||第二章(六)Z∈RN×p其最小化观测和估计之间的误差,并且通常与平滑度约束一起使用然而,这样的公式在RN×p的本征空间中工作,而没有利用信号的带限处理其他需要L完全对角化的约束也可能在计算上具有挑战性。因此,我们利用一组标准正交基Uk=[χ1,χ2,· · ·,χk],将此问题带入其图Fourier空间中,并在Uk所张成的对偶空间中寻找解.傅立叶表示的最基本的性质之一是它的稀疏性。在许多情况下,即使是密度很大的下一个顶点取决于先前的观察结果。直到最近阶段的观测集表示为部分实现θ,其域定义为dom(θ)={v|( v , o ) ∈θ} 。 选 择 过 程 定 义 策 略 π={π1 ,π2,· · ·πm},其是m个选定顶点的有序集合。给定策略π,函数f:2V×OV→R依赖于顶点的选择及其状态.定义V(π,Γ)为实现Γ下的顶点集合,我们可以将识别最优策略的问题公式化为favg=E[f(V(π,Γ)),Γ],π∈ arg max favg(π)s.t. |≤k| ≤ kπ这就是所谓的自适应随机最大化问题[13]。有条件的预期边际效益定义为(v)|θ)= E[f(dom(θ)<${v},Γ)− f(dom(θ),Γ)|(8)3572i=1i=1我们知道,函数f:2V×SV:→R是自适应单调的,当v= 0时,|θ)≥ 0和自适应子模的条件|θ)≥ θ(v|[13]《易经》中的“道”。这样的问题很容易通过贪婪算法近似地解决,其通过能量传播过程测量顶点n和n ′在尺度s上的距离。使用这些概念,给定j次选择后的Ij,下一次选择的杠杆值Ij+1最大化(v|θ)在每次迭代中。 例如,如果V是放置某些传感器的潜在位置,f()是Ij+1 =Ij -ηjD(12)计算传感器覆盖的面积的函数,给定一些传感器随机失效的概率(即,p(γ)),可以通过这样的算法最大化由所选择的传感器覆盖的总预期面积由于V的大小,这种设置在计算上可能具有挑战性,并且需要精确的先验概率。因此,我们通过计算“杠杆值”来解决以更简单的方式选择顶点的问题,在我们的公式中,一旦基于杠杆测量选择了顶点并且获取了数据,则其状态被固定(即,放置的传感器不会失效)。请注意,这样的设置使问题具有决定性。然而,一旦我们观察到顶点的状态并评估其对信号恢复过程的贡献,其中ηj是设置Ij+1(πj)=0的常数。请注意,对于第j次和第(j + 1)次迭代时同一顶点v上的杠杆值Ij(v)和Ij+1(v),Ij(v)≥ Ij+1(v),D> 0。有了杠杆值Ij,我们定义了一个效用函数,Σ|π|f(π)=Ii(πi),它是I(·)的和,每个选择。利用下面的两个结果,我们证明了我们的效用函数是自适应单调和自适应子模的,并且可以用贪婪的方式近似求解引理1. 给定当前策略π={π1,π2,· · ·,πj},Σj大小j,f(π)=Ii(πi)是自适应单调的。证据添加一个观察到π的顶点v的条件收益是(v)|π)=f(do m(π)<${v}|π)−f(do m(π)|π)cess,我们将自适应地修改所有剩余顶点的杠杆值以进行下一次选择。即一旦Σj=i=1Ii(πi)+Ij+1(v)−Σji=1Ii(πi)顶点被添加到策略π,我们将执行如3.1节中所述的信号恢复过程,以评估在新选择的顶点处信号恢复得有多好,这将自适应地影响我们的下一个选择。在这种情况下,给定政策π的条件边际效益(不再是预期)定义为:(v)|π)= f(dom(π)<${v}|π)− f(dom(π)|π)(9)=Ij+1(v)≥0这个引理表明,添加顶点v的好处总是非负的,并且f(π)遵循单调性的传统定义(即,f(A)≤f(B)成立,只要A<$B)具有正的I。引理2. 给定两个大小为j的策略π和大小为j′的策略π′,这是(8)的一种特定情况,而不是固定策略π一个随机的实现。其中π<$π′,我们的效用函数f(π)=自适应子模ji=1Ii(πi)是接下来,为了定义我们的效用函数,我们定义一个描述每个顶点重要性概念的度量。在每个顶点,我们可以将杠杆值定义为证据来自两个观察结果的条件效益之间的差异(即,π和π′是(v)|π)−π(v|π′)=f(do m(π)<${v}|π)−f(do m(π)|π)克鲁姆克I(n)=l=1g(λ1)×1(n)2(10)-(f(dom(π)<${v}|π)−f(dom(π)|π))=Ij+1(v)−Ij′+1(v)≥0这是δn在顶点n处的重构,使用Uk和a核函数g()[31,3,1,15,19]。杠杆值I(n)≥0描述了在尺度s下在顶点n处保留了多少能量,并且粗略地描述了在具有有限数量的碱基的情况下在每个顶点处可以恢复信号的程度。为了在所选顶点上进行准确的信号恢复,我们希望在为π选择顶点v时优先考虑具有高I的顶点。此外,我们假设相邻顶点上的信号可以是相似的(即,平滑),并且当它被选择时从v的相邻顶点向下调制Is。为了定义顶点之间“接近度”的概念3573这个结果表明,效用函数f(π)满足子模性的传统定义的自适应模拟[12](即,f(A<${v})−f(A)≥f(B<${v})−f(B),当A<$B<$V且v∈V\B),并且它可以用来构造一个自适应次模优化问题.给定我们的自适应子模块效用函数,我们通过公式化以下问题将此迭代过程定义为选择和恢复(SR)方法:ΣjDs,n′(n)=Σkl=1g(sλl)×l(n′)×l(n)(11)π∈arg maxπS.T. Ii+1i=1=IiIi(πi)(13)- ηiD,j≤ m。3574166这样的自适应子模块问题通过具有性能保证的贪婪算法来解决[13]。一旦我们获得了最佳ππ,我们就可以最终确定一组选定的顶点W和投影矩阵P,它们是我们的信号恢复步骤的关键成分。使用W,我们经历了3.1节中描述的过程,并获得未知信号的估计。整个流水线在下面的算法1中进行了总结,其中我们在每次迭代中解决了LASSO,这很容易扩展。算法1:选择和恢复(SR)方法输入:顶点集V,标准正交基Uk,选择总数m和D更新参数α输出:Z:恢复信号1 π← π,s←02 使用如(10)中的Uk导出I(n)3 对于i= 1到m,∗这给了我们一个有趣的数据集来评估我们的算法。对于每张图片,我们获得了社区投票的我们还创建了Imgur上最常用词的词典(例如,被否决和否决),这些都被从评论中删除了。我们删除了那些没有提供图片的类别和评论少于10条的图片。我们最终的数据集由75个类别的10K图像组成。Setup. 一个10K顶点的图(即,通过计算来自每个图像的评论之间的成对相似性为了计算相似度,首先清理评论(即,使用自然语言工具包(NLTK)[2]和使用Word 2 Vec [30]的vec- tor嵌入。然后,使用经过净化的注释来计算Word4选择步骤:v5π←π <${v<$}=arg maxv(v|π)(WMD)[23]使用HTCondor分布式计算软件。在我们的例子中,大规模杀伤性武器的范围在(4, 16),我们使用f(dom(π))7回收步骤:获得Z∗如第3.1节所述一个高斯核,将大规模杀伤性武器转换为(0, 1)内为了在8秒←α|f(πi)−Z(πi)|910端部Ii+1 ←我我 -ηiDs每幅图像,我们使用你只看一次(YOLO)[29],基于MSCOCO图像预训练的深度学习框架11返回Z4. 实验结果在本节中,我们将使用我们的框架在三个不同的数据集上展示各种实验结果。第一个独特的数据集由我们从Imgur(http://www.imgur.com)收集的图像和评论组成,在那里我们定性地评估了我们的框架,用于在对象检测器失败的图像中标记对象。第二个数据集是公开可用的MSCOCO,在那里我们对具有人类指定对象标签的多标签学习问题进行定量评估。SR方法如何在这些数据集上工作的基本示意图如图所示。3.第三章。最后一个实验集中于阿尔茨海默病(AD)图像数据集,该图像数据集由具有匹兹堡化合物B正电子发射断层扫描(PIB-PET)扫描和脑脊液(CSF)数据的参与者组成。在这里,我们使用CSF测量和SR方法来预测PIB成像测量,其中CSF数据的获取要便宜得多。和类别。将置信水平阈值化后,40%,我们最终得到了6329张至少有一个标签的图像我们应用SR框架(使用α= 1和α= 0。01)在这个图表上,对象标签作为顶点如图所示3 .第三章。请注意,我们的框架工作在在线方式。我们首先选择一个顶点(即,图像)π1,并如在3.2节中那样获得对应的图像标签,然后如在3.1节中那样运行恢复过程,这将通知应该如何选择下一个顶点π2。在运行该过程m次直到πm之后,我们获得要用于最终图像标签恢复的策略π。我们将用总样本的m=50%来证明我们的结果选择5000个(10 K个)顶点以获得图像标签,并对包括5000个顶点在内的所有顶点执行估计,其中我们的模型尚未获得测量(类/对象标签)。请注意,我们没有地面实况(即,真实对象标签)。因此,我们在图像上显示了各种有趣的定性结果,其中YOLO没有以高置信度检测到物体。π1:汽车,猫435π1:汽车,猫435结果我们的代表性结果的对象标签估计的图像上的图像显示在图。4.第一章未观测未观测猫猫请注意,我们无法为ob分配任何标签π3:2号车118未观测7π2:猫π3:2号车1车87π2:猫在这些图像中使用YOLO,因为这些对象被严重遮挡/缩放,而不是传统形状或艺术对象。然而,我们的框架成功地建议-未观察2π4:香蕉香蕉2π4:香蕉图3:我们在图像数据集上的工作流程。左:图像和文本,中:从文本和策略π(黄色顶点)导出的图,右:未观察到的顶点(红色顶点)上的恢复对象标签。4.1. 基于目标检测数据集的目标标签估计。我们使用MSCOCO类别来选择Imgur上的一个类别子集,这些类别提供图像和com。144∗3575gested标签的一些未标记的图像与我们的75预定义的类别。对于YOLO和我们的方法都没有产生任何标签的图像,事后分析表明,这些图像中的许多图像几乎不包含视觉背景。更多结果见附录。有一些失败的案例我们的方法-3576(鸟){手机}{cat}{人,马}马【书】【狗】联系我们{汽车}图4:来自Imgur实验的对象标签估计的各种结果。YOLO没有自信地在这些图像上分配任何标签(即,低于40%的置信度)使用我们的75个类别。然而,我们的框架表明,这些图像中有一些物体在我们的框架中,图像表示节点,线条表示边缘,具有相同对象标签的图像之间存在很强的关系。签署虚假标签,一般属于下列情况之一:1)SR预测“人”,但仅预测人的一小部分(例如,手、手臂或手指),2)SR检测具有描述对象的文本图像的对象3)图像中存在相似/相关的对象但不精确(例如,汽车中心标记为“汽车”)。其中一些例子仍然是有趣的显示在图。五、4.2. MSCOCO数据集上的多标记学习数据集。我们使用MSCOCO数据集,其中有82个不同对象类别和相关captions的1328000张图像可用[24]。我们从80个不同的类别中检索了前80个图像及其相应的标题,以生成一个较小的数据集来评估我们的SR方法。当类别之间的重叠图像被丢弃时,我们的数据集包括5440张图像。Setup. 基于来自5440个图像的标题(即,5440图5:我们的方法分配错误标签的图像示例。我们分配了汽车作为车身修理厂(左),羊而不是羊形状的椅子(中)和人而不是人形状的苹果(右)。节点)。边缘的定义与第4.1节中的方法相同,使用大规模毁灭性武器。在每个顶点处的测量被给出为表示对象标签的二进制1× 80向量,其中非零元素指示对应的对象是否存在于图像中将其中的5440个连接起来,我们得到一个f5440×80的矩阵,作为基础事实。根据采样率,根据我们的策略π选择矩阵的m个行以获得对象标签,并且我们恢复所有行上的测量请注意,地面真值标签是倾斜的,即,0s支配1s,因为每个图像中只有少数对象。因此,为了评估我们的算法,我们计算了SR产生的错误数量以及预测的平均精度。我们将我们的结果与其他两种基线方法进行了比较:1)Puy等人[27]和2)Rao等人。[28],这是最先进的图形完成方法。对于信号恢复步骤,我们使用α= 1,α= 0。01,在我们的算法中只有60%的总基地用于估计,而其他方法需要所有的。结果. 在恢复所有图像的对象标签后,我们将估计阈值设置为0。15以使所恢复的标签二进制化(即,如果恢复的信号> 0,则为1。15和0,否则)。由于基线方法是随机的,我们运行了100次,并计算了具有优化参数的评估分数的平均值。表1显示了(435200次估计中)3577我们的策略的大小(或样本总数)。随着我们选择的样本数量的增加,三种方法的误差都在减小,我们的方法误差最小。我们还报告了所有猫的平均精度-采样我们的(SR)Puy等人Rao等人百分之二十1953121274.623992.6百分之三十1724619503.320427.7百分之四十1500317862.217762.4百分之六十899210689.611906.9表1:恢复的测量值中的错误数图中的错误而不是准确性。六、在这里,精度随着策略大小的增加而增加,我们的结果显示出比基线以及[20]中达到0的精度更高的精度。84个,占总顶点的60%。图6:所有类别的平均精密度(相对于采样率)。随着样本数量的增加,精度也会增加。SR(红色)在所有采样率下的精度均高于Puy等人(绿色)和Rao等人(蓝色)。4.3. 使用CSF估计PIB度量数据集。我们的AD数据集包括79名参与者,其中PIB-PET扫描和CSF都可用。PIB-PET扫描的体素强度测量大脑中的淀粉样斑块病理学,这与大脑功能高度相关,做CSF措施,这两个措施是众所周知的高度(负)相关[11]。我们将大脑分成多个感兴趣区域(ROI),并取16个选定ROI中PIB测量值的平均值,以获得ROI特异性PIB测量值。从CSF数据中,我们获得了每个参与者的不同蛋白质水平。附录中给出了数据集的更多细节Setup. PIB图像和CSF测量涉及不同的成本,其中PET扫描要昂贵得多,并且CSF测量通常作为PET扫描的替代品来获取。 在这个实验中,我们试图估计PET基于来自整个队列的CSF测量值的图像衍生测量值和参与者子集的PET图像衍生测量值。使用来自每个参与者的CSF测量的图(即,顶点)是通过测量相似性(即,边),其中σ= 1。 然后,我们像在Alg中一样应用我们的框架。1决定从16个ROI上的v∈π获得PIB成像测量的策略,并重新3578覆盖所有(剩余)参与者的措施。我们使用了=0。对于稀疏参数,k=50个特征向量,对于信号恢复步骤,α结果.我们证明了误差的用于评估的地面实况和恢复的测量。同样,我们运行基线方法500次,以计算由于其随机性而产生的误差的平均值。我们通过改变m来运行实验,并报告总样本的m={30%, 50%}的结果。如图1所示7,我们的结果(红色)显示比基线方法低得多的误差。当我们使用这些估计结果来确定每个参与者是否具有升高的淀粉样蛋白负荷(即,所有ROI上的PIB测量值的平均值是否> 1个。18),我们的估计提供了91. 1%的准确率[27][28]第28话6%,87。6%。图7:使用SR(红色)恢复的信号与地面真实值之间的ROI平均值误差为102 −范数,Puy等人(绿色)和Rao et al.(蓝色)。顶部:使用总样品的30%,底部:使用总样本的50%。5. 结论在现代计算机虚拟现实的各种情况下,在此基础上,研究了多变量信号在图的顶点上的自适应完备化问题。通过在图的频域中表达优化,我们展示了基于自适应子模块性的简单算法如何在大规模的视觉数据集上,我们的建议通过解决一个补充问题(使用辅助信息)来补充目标检测算法该模型提供了有希望的证据,如何在预算限制下进行神经影像学研究我们的开源发行版将使应用程序能够应用于视觉中的其他设置,其中涉及部分测量和/或对结构化为图形的数据的顺序观察6. 确认这项研究得到了NIH资助AG040396的支持,AG021155 、 EB022883 、 NSFCAREERaward1252725、UW ADRC AG033514、UW CIBM 5T15LM007359 -14和UW CPCP AI117924。3579引用[1] M. 奥布里,美国Schlickewei和D.克莱姆斯 wave内核签名:形状分析的量子力学方法。在ICCV研讨会上,第1626-1633页。IEEE,2011年。5[2] S. Bird,E.Klein和E.洛珀自然语言处理Python“O'ReillyMedia,Inc." 2009. 6[3] M. M. 布朗斯坦和我。Kokkinos 用于非刚性形状识别的尺度不变热核见CVPR,第1704-1711页。IEEE,2010。5[4] J. - F. Cai、E. J. C和E,Z。 沈矩阵完备化的奇异值SIAMJournal on Optimization,20(4):1956-1982,2010.二、四[5] E. J. Candes和Y.计划 带噪声的矩阵补全Proceedings of the IEEE,98(6):925-936,2010. 2[6] E. J. C和E和B。Recht. 通过凸优化的精确矩阵完成计算物理学,9(6):717-772,2009。二、四[7] F. R. 阿忠谱图理论,第92卷。AMS书店,1997年。3[8] R. Coifman和M.马焦尼扩散小波应用和计算谐波分析,21(1):53二、三[9] R. R. Coifman和S.拉丰扩散贴图。应用和计算谐波分析,21(1):5-30,2006年。5[10] D. L. Donoho 压 缩 感 知 。 IEEE Transactions onInformation Theory,52(4):1289-1306,2006. 2[11] A. M. Fagan,M.A. 明通河H. Mach,,et al.人体内淀粉样 蛋 白 成 像 负 荷 与 脑 脊 液 aβ 42 呈 负 相 关 Annals ofNeurology,59(3):512 8[12] S.藤重次模块化功能和优化,第58卷。Elsevier,2005年。5[13] D. Golovin和A.克劳斯自适应子模块化:主动学习和随机优化中的理论和应用。Journal of Artificial IntelligenceResearch,42:427四五六[14] D. 哈蒙德,P。Vandergheynst和R.格里邦瓦尔基于谱图论的图上的小波。应用和计算谐波分析,30(2):129- 150,2011年。二、三[15] N.胡河,巴西-地M. Rustamov和L. Guibas用于图匹配的稳定和在CVPR中。IEEE,2015年。5[16] H.吉角,澳-地Liu,Z. Shen和Y.徐使用低秩矩阵完成的鲁棒视频去噪。见CVPR,第1791- 1798页2[17] K. I. Kim. 基于图函数与拉普拉斯算子联合扩散的半监督学习见ECCV,第713施普林格,2016年。1[18] W. H.金湾,澳-地B. Bendlin,M. K. Chung等人具有系统变化的图像数据集的统计推断模型。在CVPR中,第4795-4803页。IEEE,2015年。5[19] W. H.金,M。K. Chung和V.辛格.通过非欧几里德小波的多分辨率形状分析:应用于网格分割和表面对齐问题。在CVPR中,第2139-2146页。IEEE,2013。5[20] W. H. Kim,S. J. Hwang,N. Adluru等人神经影像学实验设计中通过谐波分析的图形自适应信号恢复。见《欧洲法院判例汇编》,第188施普林格,2016年。二四八[21] A. Krishnamurthy和A.辛格. 低秩矩阵和张量通过自适应采样完成。NIPS,第836-844页,2013年二、四[22] S.库马尔,M。Mohri和A. Talwalkar Nystr o?m方法的取样方法。 JML R,13(1):981-1006,2012. 二、四[23] M. J. Kusner,Y.太阳,N. I. Kolkin和K. Q.温伯格从词嵌入到文档距离。在ICML,第957-966页,2015中。6[24] T.- Y.林,M。迈尔,S。Belongie等人微软coco:上下文中的公用对象。参见ECCV,第740Springer,2014. 7[25] Z.林河,巴西-地Liu和Z.苏低秩表示的线性化自适应惩罚NIPS,第612-620页,2011年。2[26] S.马拉特信号处理的小波之旅。学术出版社,1999年。3[27] G. Puy,N.特伦布莱河Gribonval等人图上带限信号的随机抽样。应用和计算谐波分析,2016年。二、四、七、八[28] N. Rao,H.- F. Yu,P. K. Ravikumar等人使用图形信息进行协作过滤:一致性和可扩展的方法。2015年,在NIPS中。二、四、七、八[29] J.雷德蒙,S.迪夫拉河,巴西-地Girshick和A.法哈迪。你只看 一次:统一的 实时物体检 测。arXiv预印本arXiv:1506.02640,2015年。6[30] R. Reh urek和P. 索伊卡用大型语料库进行拓扑建模的软件框架LREC 2010 NLP框架新挑战研讨会论文集,第45-50页。ELRA,May 2010. 6[31] R. M. Rustamov变形不变形状表示的Laplace-Beltrami特征 函 数 。 在 Eurographics Symposium on GeometryProcessing中,第225-233页。欧洲制图协会,2007年。5[32] S.Haykin和B.诉维恩信号和系统。Wiley,2005年。3[33] J. Tang,R.洪,S. Yan,T.- S. Chua,G.- J. Qi和R.贾恩。基于k-NN稀疏图的标签传播对噪声标记的
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- IEEE 14总线系统Simulink模型开发指南与案例研究
- STLinkV2.J16.S4固件更新与应用指南
- Java并发处理的实用示例分析
- Linux下简化部署与日志查看的Shell脚本工具
- Maven增量编译技术详解及应用示例
- MyEclipse 2021.5.24a最新版本发布
- Indore探索前端代码库使用指南与开发环境搭建
- 电子技术基础数字部分PPT课件第六版康华光
- MySQL 8.0.25版本可视化安装包详细介绍
- 易语言实现主流搜索引擎快速集成
- 使用asyncio-sse包装器实现服务器事件推送简易指南
- Java高级开发工程师面试要点总结
- R语言项目ClearningData-Proj1的数据处理
- VFP成本费用计算系统源码及论文全面解析
- Qt5与C++打造书籍管理系统教程
- React 应用入门:开发、测试及生产部署教程
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功