没有合适的资源?快使用搜索试试~ 我知道了~
1GODS:用于异常检测的广义一类判别子空间王珏堪培拉澳大利亚国立大学jue.wang邮件anu.edu.au阿努普·切里安三菱电机研究实验室,马萨诸塞cherian@merl.com摘要单类学习是一个经典的问题,即将模型拟合到只有一个类可用注释的数据。在本文中,我们提出了一个新的单类学习的目标。我们的关键思想是使用一对标准正交框架-作为子空间-通过联合优化两个目标来“三明治”标记数据:i)最小化两个子空间的原点之间的距离,以及ii)最大化超平面和数据之间的裕度,任一子空间分别要求数据处于其正正交和负正交。然而,我们提出的目标导致一个非凸优化问题,我们诉诸黎曼优化计划,并得到一个有效的共轭梯度法的Stiefel流形。为了研究我们计划的成效,我们建议一个新的数据集Dash-Cam-Pose,由坐在汽车里的人的骨架姿势的剪辑组成,任务是将剪辑分类为正常或异常;后者是当任何人的姿势相对于例如气囊展开不在适当位置时。我们在建议的Dash-Cam-Pose数据集以及其他几个标准异常/新奇检测基准上的实验证明了我们的方案的好处,实现了最先进的一类精度。1. 介绍存在几个现实世界的问题,其中可能容易表征系统的正常操作行为或为其收集数据,然而当系统出现故障或被不正确地使用时,可能难以或有时甚至不可能获得数据例子包括但不限于空调产生不必要的振动,网络被入侵者攻击,异常的患者状况,如心率,视频监控摄像头中捕获的事故,或汽车发动机不规则间隔点火等[11]。在机器学习文献中,在MERL实习期间完成的工作(a) OC-SVM(b)SVDD(C)BODS(OUR)(D)GODS(OUR)(我们的)图1.经典的OC-SVM和SVDD与我们提出的BODS和GODS计划的关系的图形说明 蓝色点表示给定的一类数据,红色点表示异常值,橙色曲线/直线表示每种方法的决策边界。通常被称为一类问题[4,44],这意味着我们可以为一类(对应于系统的正常操作)提供无限的标记训练数据因此,这些问题的主要目标是学习适合正常集的模型,使得异常可以被表征为该模型的离群值。单类问题的经典解决方案主要是对支持向量机(SVM)的扩展,例如单类SVM(OC-SVM),它最大化了从原点开始的判别超平面的边缘[46]。该方案有一些扩展,例如最小二乘单类SVM(LS-OSVM)[14]或其在线变体[58],它们学习找到包括所有标记数据的最小直径管。另一种流行的方法是支持向量数据描述(SVDD),它找到一个hy-82018202封装训练数据的最小半径的persphere [51]。也有这些方案的核化扩展,其使用核技巧将数据点嵌入可再现的核希尔伯特空间中,潜在地用任意形状的边界包围“正常”数据。虽然这些方法已经显示出优势,并已在多个应用中被广泛采用[11],但它们也有缺点,促使我们超越现有的解决方案。例如,OC-SVM仅使用单个超平面,但是使用多个超平面可能是有益的,并且提供了标记集的更丰富的表征,最近也在[56]中提出。SVDD方案对数据分布的球形性质做出了强烈的假设,这在实践中可能很少是真的。此外,使用内核方法可能会影响可伸缩性。受这些观察结果的启发,我们提出了一种新的一类分类目标:(i)学习一组判别超平面和正交超平面作为子空间,以模拟多线性分类器,(ii)学习一对这样的子空间,一个子空间从下面界定数据,另一个子空间从上面界定数据,以及(iii)最小化这些子空间之间的距离,使得数据在最小体积的区域内被捕获(如在SVDD中)。我们的框架生成一个分段线性决策边界,并在输入空间中操作。尽管有这些好处,但由于正交性约束,我们的目标是非凸的然而,幸运的是,这种非凸性不是一个重要的问题,因为正交性约束自然地将优化目标置于Stiefel流形上[17]。这是一个研究得很好的黎曼流形[6],我们可以使用有效的非线性优化方法。我们使用一个这样的优化方案,称为黎曼共轭梯度[1],这是快速和有效的。为了评估我们提出的方案的有用性,我们将其应用于检测汽车中异常或“位置外”人类姿势的具体设置这个问题在车辆乘客安全中最为重要,因为如果气囊被释放,坐在OOP的人可能会受到致命伤害[43,36,25]。这个问题在自动驾驶汽车中更加严重,(未来)可能根本没有任何司机来监控乘客的安全。等狮子的人类姿势(使用OpenPose提取 [8])。每个剪辑都是从长的互联网视频或好莱坞公路电影中收集的,并使用二进制标签进行了弱注释,表示乘客在整个剪辑期间是否正确就座或不在正确位置。我们展示了我们的方法在Dash-Cam-Pose数据集上的有效性,以及其他几个流行的基准,如UCF-Crime[50],动作识别数据集,如JHMDB [23]和两个标准的UCI异常数据集。我们的实验表明,我们提出的方案导致超过10%的性能提高经典和最近的方法,我们评估的所有在继续详细介绍我们的方法之前,我们总结了本文的主要贡献:1. 我们首先介绍了一类判别子空间(BODS)分类器,使用一对超平面。2. 我们推广BODS使用多个超平面,称为广义一类判别子空间(GODS)。3. 我们提出了一个新的Dash-Cam-Pose数据集,用于汽车内乘客的异常姿势检测,4. 我们提供了在Dash-Cam-Pose数据集以及其他四个公共数据集上的实验,展示了最先进的性能。2. 背景及相关作品令DRd表示由我们的一个感兴趣的类别和它之外的所有内容组成的数据集,表示为D,是异常集。假设我们有n个数据实例Do={x1,x2,···,xn} D。单类分类器的目标是使用Do来学习函数f,该函数f在D上为正,在D上为负。通常,D的标号被假定为+1,D的标号被假定为-1。在单类支持向量机(OC-SVM)[46]中,f被建模为SVM目标的扩展,通过学习将原点与Do中的数据点分开的最大边缘超平面。在数学上,f的形式为sgn(wTx+b),其中(w,b)∈Rd×R1,并且是学习的最小化以下目标:1Σnminǁwǁ2−b+C圣托里尼岛wTx≥b−1,1 x∈D,OOP人体姿势包括面部的异常位置(such如向后转),仪表板上的腿等,举w,b,n≥022我i=1我我我几个.因为定义什么是正常的坐姿可能很容易,而对异常坐姿建模可能太困难,所以我们将这个问题放在一类设置中。由于没有公开的数据集可用于研究这个问题,我们提出了一个新的数据集,Dash-Cam-Pose,由近5 K的短视频片段组成,包括近百万个视频片段。其中,R1由于单个超平面可能不足以捕获与一类相关的所有非线性,因此存在通过内核技巧使用非线性内核的扩展[46]。然而,与核化支持向量机一样,这样的公式化是困难的8203to scale规模with the number数of data数据points点.单类分 类 器 的 另 一 种 流 行 变 体 是 支 持 向 量 数 据 描 述(SVDD)[51],它不是将数据建模为Rd的开放半空间(如OC-SVM),而是假设标记的数据存在于有界集合中;具体来说,op-vector数据描述(SVDD)[52]是一种基于向量的分类器。最小化寻找一个最小半径R>0的超球面的质心c∈Rd,它包含Do中的所有点。数学上,目标是:存在类似的先前工作,称为Slab-SVM [18],其学习用于一个类别分类的两个超平面。然而,这些超平面被限制为具有相同的斜率,这在我们的BODS模型中没有强加,因此,我们的模型比Slab-SVM更一般。我们通过使用多个超平面来扩展BODS公式,作为判别子空间,我们称之为广义一类判别子空间(GODS);这些子空间1Σ最小R2+C塞里什山<$xi−c<$2≤R2−<$i,<$xi∈Do,空间为一类数据提供了更好的支持,同时也限制了数据分布。使用这种c,R,ε≥022i=1最近,在Wang的视频表示学习的背景下,其中,如在OC-SVM中一样,Stimulator对松弛进行已经该方案的扩展,例如mSVDD使用这种超球体的混合物[29],密度诱导的SVDD [30],使用内核化变体[52],以及更近的,使用子空间进行数据描述[49]。SVDD的一个主要缺点通常是它对底层数据分布的各向同性性质的强烈排斥。通过将OC-SVM与最小二乘单类SVM(LS-OSVM)[ 14 ]中的SVDD思想相结合来改善这种需求,该最小二乘单类SVM [ 14]学习包含输入的区分超平面周围的管道;然而,该方案还对数据分布(例如圆柱形)进行了强假设。在图1(a)和1(b)中,我们以图形方式说明了OC-SVM和SVDD方案。与学习紧凑数据模型以封闭尽可能多的训练样本的OC-SVM 不 同 , 不 同 的 方 法 是 使 用 主 成 分 分 析( PCA ) ( 及 其 核 化对 应 物 , 如 核 PCA和 RoboustPCA[7,15,20,38,60])通过使用其主子空间来总结数据。然而,这种方法通常是不利的,因为它的高计算成本,特别是当数据集很大时。与提出的技术动机相似,Bodesheim et al.[5]使用零空间变换进行新颖性检测,而Liu et al.[34]优化基于内核最大边际目标,以去除离群值和软标签分配。然而,他们的问题设置与我们的不同之处在于[5]需要训练数据中的多类标签,而[34]是针对非监督学习提出的。与以往的方法不同,本文从一个非常独特的角度对单类目标进行了研究;具体地,为了使用如PCA中的子空间,然而不是近似一类数据,而是通过求解判别目标,以分段线性方式约束数据的方式来对齐这些子空间。首先,我们提出了一个简化的变体,通过使用两个不同的(集)超平面,称为基本一类判别子空间(BODS),可以通过从不同的侧面绑定来夹持标记数据;这些超平面被独立地参数化,因此可以被不同地定向以更好地拟合标记数据。注意Cherian [56] and Wang et al.[57],然而,需要通过对抗手段发现的特征的替代否定包异常检测:在计算机视觉中,异常检测已经从几个方面进行了探索,我们参考-读者对[11,42]中提供的关于这个主题的优秀调查感兴趣。在这里,我们挑选了一些与我们提出的实验相关的先前工作。为此,亚当等人,[2]和Kim等人。[26]使用光流来捕捉运动动力学,表征异常。在[32,48]中使用人和物体轨迹的高斯混合建模来识别视频序列中的异常。显着性在[22,24]中使用,并且在[13,40]中使用支持图和生成模型来描述正常和异常数据,探索了检测上下文外对象。我们也知道最近的深度学习方法用于一类问题。在[31,33]中探索了特征嵌入(通过CNN),最小化“分布内”样本距离,以便通过合适的因此,我们试图找到一个合适的“在分布”的数据边界,这是不可知的数据嵌入。在[45]中提出了SVDD的深度变体,但是假设单类数据是单峰的。在[59,10,41]中有OC-SVM到深度设置的由于现代CNN模型的巨大容量,经常发现学习的参数很快过拟合到一个类;需要启发式的变通方法来正则化或避免模型崩溃。因此,到目前为止,深度方法主要用作特征提取器,然后在传统的一类公式中使用这些特征,例如[10]。我们遵循这一趋势。3. 该方法使用上面的符号,在本节中,我们正式介绍我们的计划。首先,我们提出了我们的基本思想,使用一对超平面,我们推广使用一对判别子空间一类分类。3.1. 基本一类判别子空间假设(w1,b1)和(w2,b2)分别定义一对超平面的参数,我们的目标是在一类判别子空间(BODS)分类器的基本变量中,n82042DD2W121WDJ11最小化目标,使得所有数据点xi被分类到(w1,b1)的正半空间和(w2,b2)的负半空间,同时还最小化两个超平面之间的适当距离。在数学上,BODS可以公式化为求解:最小值±2+w ,)WTW2=IK,其中IK是K×K单位矩阵。这样的框架属于所谓的Stiefel流形,记为SK,具有K d维子空间。注意,W i的正交性假设是为了确保它们捕获不同的鉴别方向,从而导致更好的region。去极化;还进一步改进了它们对数据分布的表征。P1的直接延伸导致:(w1,b 1),(w2,b 2),2β1,β 2,β>0122221 21我2我P2:= min dist2(W1,W2)+α(b1,b2)+ α(β1i,β2i). TΣ(一)W∈SK,n≥0,bW日本语中文(简体)S.T. w1xi−b1≥η−1i(2)+η−min(W1xi+b1)−1i(六). wT x2我2Σ-b2≤−η+2i(3)+我ΣΣΣ2+η+ max(WTxi+b2)+2i、(7)dist((wi,b1),(w2,b2))≤β,βi=1,2,···,n,(4)2+我其中(2)约束点,使得它们属于(w1,b1)的正半空间,而(3)约束点属于n ∈g在iv eh(w2,b2)的自同构空间。We其中distW是子空间之间的合适距离,并且b∈RK是一个偏置向量,每个偏置向量对应一个超平面。注意,在(6)和(7)中,与BODS不同,WTx+b是K-使用符号(1i,2i)=Cni=1 (1i+2i),我维向量因此,(6)表示最小值松弛正则化和η>0指定一个(给定的)分类,保证金。 这两个超平面有自己的参数-然而,通过(4)将它们约束在一起,这旨在最小化它们之间的距离dist(通过β)。一种可能性是假设dist是欧几里得距离,即,dist2((w1,b1),(w2,b2))=<$w1−w2<$2+(b1−b2)2。根据经验,特别是在单类设置中,经常发现允许权重wi导致对标记数据的过拟合;一个实际的想法是显式地正则化它们,使其具有单位范数(数据点X(1),即,w1在这种情况下,这些权重属于单位超球面Ud−1,即欧氏流形Rd的子流形。使用这样的流形约束,(1)中的优化可以重写(使用铰链损失变量用于其他约束)如 下 , 我 们 称 之 为 我 们 的 基 本 一 类 判 别 子 空 间(BODS)分类器。P1:=minα(b1,b2)−2wTw2+<$(<$1i,<$2i)(5)这个向量的值应该大于η,并且(7)说它的最大值小于−η。现在,让我们仔细看看距离W(W1,W2)。假设W1,W2是子空间,一个标准的可能性是,对于一个距离是普鲁斯特距离[12,55],定义为min<$∈PK<$W1−W2<$<$F,其中PK是K×K置换矩阵的集合然而,在问题P2中包括这样的距离使其在计算上昂贵。本最后,我们提出了一个稍微不同的变体,这个距离要便宜得多。回想一下,定义子空间之间的距离的主要动机是使它们以最佳的方式将(一类)数据点夹在中间,同时也迎合数据分布。因此,不是定义这样的子空间之间的距离,而是还可以使用使每个数据点与两个超平面的欧几里得距离最小化的测量;从而实现相同的效果。也就是说,我们将dist2重新定义为:w1,w 2∈Ud−111,dist2(W1,W2,b1,b2|x)=Σ2¨¨2WT x+ bj、(8)ΣΣ+η−.ΣwTxi+b1−1iΣ Σ++η+.ΣwTxi+b2WΣ+2i+,J2j=1我其中使用单位范数约束dist2简化为−2wTw2+(b1−b2)2,且α(b1,b2)=(b1−b2)2−b1−b2。符号[ ]+代表铰链损失。在图1(c)中,我们展示了BODS模型的决策边界。3.2. 广义一类歧视性小组现在我们最小化每一个的长度和在投影到相应的子空间上之后的x;从而将两个子空间拉得更靠近数据点。使用dist2的该定义,我们将我们的广义一类判别子空间(GODS)分类器公式化为:1n22空间P3:=最小F=W∈SK≥0,b2i=1j=1WTxi+bj+α(b1,b2)为了做好准备,让我们先看看如果我们-+(,n)+νντη−min(WTx +b)−100在BODS中引入子空间而不是超平面。本282051最后,设W1,W2∈SK是子空间框架,1我2in我1i11i+D尺寸为d×K的三角形,每个三角形有K列,其中1ΣΣ+Σ2η+ max(WTxi+b2)+2i.(九)每一列与其余列正交;也就是说, WTW1=2n i2+8206JnJ图1(d)描述了GODS模型中与其他方法相关的子空间。如直观清楚的,使用多个超平面允许更丰富的一类的表征,这在其他方案中是困难的。4. 高效优化与OC-SVM和SVDD相比,由于W1和W2上的正交约束,问题P3是非凸的。[1]然而,这些约束自然地对解空间施加了几何学,在我们的例子中,将W黎曼流形上的几何优化已有几种格式(详细介绍见[1]),本文采用黎曼共轭梯度(RCG)格式,由于它的稳定性和快速收敛性。在下文中,我们回顾RCG方案的一些基本组成部分,并提供必要的公式,流形,设F(W)定义F的欧几里得梯度(没有流形约束),则黎曼梯度由下式给出:gradF(W)=(I-WW T)<$WF(W)。(十一)方向梯度F(W)对应于沿着流形的曲线,沿着该曲线下降确保优化目标被减小(至少局部地)。现在,回到我们的单类目标,我们需要推导出使用RCG的所有内容,就是计算我们的目标在P3中关于变量Wj欧氏和它们的梯度是直接的,并且可以通过RCG在包括Stiefel流形和欧氏流形的笛卡尔乘积的乘积流形上求解联合目标因此,唯一的非平凡部分是我们的目标相对于W用它来解决我们的目标你好 。不ΣTΣTΣ4.1. 黎曼共轭梯度回想一下,标准(欧几里得)共轭梯度W=Xii=1Wjxi+b1−Zin−Wjxi−bj−ji+,(十二)(CG)方法[1][Sec.8.3]是最陡下降法的一种变体,但选择沿着与目标参数相关的先前下降方向共轭的方向下降形式上,假设F(W)表示我们的目标。然后,CG方法在第k次迭代时使用以下递归:Wk=Wk−1+λk−1αk−1,(10)其 中 λ 是 合 适 的 步 长 ( 使 用 线 搜 索 找 到 ) ,αk−1=−gradF ( Wk−1 ) +µk−1αk−2 , 其 中 gradF(Wk−1)定义F在Wk−1处的梯度,αk−1是在当前残差上建立的方向,并且与先前的下降方向共轭(参见[1][pp.182]))。当W属于一个弯曲的黎曼流形时,我们可以使用相同的递归,但是与欧几里得CG的情况有一些重要的区别,即(i)我们需要确保更新的点Wk属于流形,(ii)存在有效的向量运输2来计算αk−1,以及(iii)梯度 梯 度 是 沿 着 与 流 形 相 切 的 空 间 。 对 于 ( i ) 和(ii),我们可以采取计算上有效的撤回(使用QR分解 ; 见 [1][Ex.4.1.2] ) 和 载 体 运 输 [1][pp.182] 。 对 于(iii),存在将目标的欧几里德梯度(即,假设不存在 流 形 约 束 ) , 并 将 它 们 映 射 到 黎 曼 梯 度[1][Chap.3]。具体来说,对于施蒂费尔1注意,函数max(0,min(z))对于z在某个凸集上也是一个非凸函数。[2]这是计算αk−1所必需的,它涉及到两个潜在不同切空间中的项 的 和 , 这 需 要 向 量 迁 移 来 在 它 们 之 间 移 动 ( 参 见[1][pp.182])。在那里我 =h(WTxi+bj),h抽象arg mink,-arg maxk分别对于W1和W2,i表示所选超平面索引(来自K),Zi是一个d×K矩阵,除了第i个列为xi外,其余都是零。4.2. 初始化由于我们的目标的非凸性,可能有多个局部解。为此,我们采取了以下优化变量的初始化,我们发现这在经验上是有益的。具体来说,我们首先根据数据点到原点的欧氏距离对所有数据点进行排序。接下来,我们收集一个合适的数量(取决于子空间的数量),这样的排序点附近和远离原点,计算这些点的奇异值分解(SVD),并初始化GODS子空间使用这些正交矩阵从SVD。5. 单值分类在测试时,假设我们有m个数据点,我们的任务是将它们中的每一个分类为属于D或D. 为此,我们使用我们的探测器的学习参数-如前所述,计算每个点的得分(us-)。ing(9))。接下来,我们对这些分数使用K均值聚类(我们也可以使用图切割),K=2。属于具有较小分数的聚类的那些点被认为属于D,其余的属于D。6. 实验在本节中,我们提供了实验,证明了我们提出的方案在几个单方面的性能8207类任务,即(i)使用Dash-Cam-Pose数据集的位置外人体姿势检测,(ii)使用流行的JHMDB数据集的视频中的(iii) UCF-Crime数据集来查找异常视频事件,(iv) - 使用声纳数据集3区分来自金属圆柱体和大致圆柱形岩石的声纳信号,以及(v) 使用Delft泵数据集4的潜水泵中的异常检测。在继续之前,我们首先介绍我们新的Dash-Cam-Pose数据集。6.1. Dash Cam Pose:数据收集离位(OOP)人体姿态检测是涉及到汽车内乘客安全的重要问题。然而,存在用于人类姿态估计的非常大的公共数据集-为此,我们从互联网上收集了大约104个视频,每个视频长20-30分钟(包括Youtube,ShutterStock和好莱坞公路电影)。由于这些视频最初是出于各种原因记录的,因此在相机角度、视角、相机位置、场景变化等方面存在显著变化为了从这些视频中提取尽可能多的片段,我们将它们分割为30fps的三秒片段,从而产生大约7000个片段。接下来,我们只选择了摄像机大约放置在仪表板上向内看的那些剪辑,总共有4,875个剪辑。我们根据前座乘客的姿势用弱二进制标签注释每个片段(后座乘客经常遭受严重的遮挡,因此,更难估计他们的姿势)。具体地说,如果所有的前座人类(乘客和驾驶员)都坐在适当的位置,则剪辑被赋予积极的标签,而如果任何人类在整个3s内都坐在OOP中,则剪辑被标记为消极的。我们不给注释的人是坐在OOP。根据[39,16]中的案例研究,对就位和离位标准进行了松散定义,主要目标是避免在气囊展开时因OOP导致乘客死亡在用二进制标签注释剪辑后,我们在每个剪辑上应用Open Pose [8],为每个人提取一系列姿势。这些序列被过滤为仅针对前座人类的姿势。图2显示了来自不同剪辑的几个帧。从示例中可以清楚地看出,OOP姿势可能是非常任意的并且难以建模;这是为该任务寻求一类解决方案的主要动机。在下面的章节中,我们将详细介绍我们的数据准备和评估方案。数据集的一些统计数据见表1。3https://www.kaggle.com/adx891/sonar-数据-集合4http://homepage.tudelft.nl/n9d04/occ/547/oc_547.html破折号-凸轮-姿态数据集结扎夹总数4875具有OOP姿势28.5%姿势总数1.06MOOP姿势310,996表1.建议的Dash-Cam-Pose数据集的属性6.2. 短跑凸轮姿势:制备与评价姿势的适当表示对于在一类任务中使用它们是重要的。为此,我们探索了两种表示,即(i)从训练集学习的姿势的简单词袋(BoW)模型,以及(ii)使用时间卷积网络(TCN)[27],该网络使用具有1D卷积层的残差单元,通过跨时间的每个关节的卷积捕获局部和全局信息对于前者,我们有1024个姿态质心,而对于后者,每个帧中每个人的姿态被矢量化并在时间维度上堆叠。我们使用的TCN模型已经在更大的NTU-RGBD数据集[47]上对3D骨架进行了预训练,用于人类动作识别任务。对于通过TCN的每个姿势,我们从最后一个池化层中提取特征,这些特征是每个剪辑的256维向量。我们使用四重交叉验证来评估Dash-Cam-Pose。具体来说,我们将整个数据集分为四个不重叠的分割,每个分割由大约1/4的数据集组成,其中大约2/3我们只使用每个分割中的正数据来训练我们的单类模型。一旦模型被训练好,我们就对持有的分割进行评估。对于每个嵌入姿态特征,我们使用二进制分类准确度来衡量性能。在所有四个分割上重复评估,并对性能进行平均。6.3. 公共数据集JHMDB数据集:是一个视频动作识别数据集[23],由21个类别的968个剪辑组成(图3中提供了说明性帧)。为了使数据集适应一类评估,我们使用一个对其余的策略,通过选择来自动作类的序列作为为了评估整个数据集的性能,我们在21个类上循环,并将分数平均。为了表示帧,我们使用image-net [28]预训练的VGG-16模型,并从'fc-6'层(4096-D)中提取帧级特征UCF-Crime数据集:是最大的公开可用的真实世界异常检测数据集[50],包括1900个监控录像和打架,抢劫等13类,以及几种来自该数据集的说明性视频帧及其类别标签如图3所示。 为了对视频进行编码,我们使用状态-8208NTN+FNTNR+NPV∗∗图2.来自我们提出的Dash-Cam-Pose数据集的帧。最左边的帧具有在位姿势(一类),而其余的帧来自标记为位置外的视频。图3.JHMDB(左两)和UCF-Crime(右两)数据集的一些示例,以及各自的类别。最先进的Inflated-3D(I3 D)神经网络[9]。具体而言,来自非重叠滑动窗口的视频帧(每个8帧)通过I3 D网络;从“Mix 5c”网络层提取特征,然后将对于测试集上的异常检测,我们首先将我们的方案分类为异常的特征映射回帧级,并应用官方评估指标[50]。声纳和Delft泵数据集:是两个UCI数据集,分别有208和1500个数据点,和两个类。我们直接采用原始特征(60-D和64-D),而不进行任何特征嵌入。我们保持训练/测试比率为7/3同时保持每个集合中每个类的原始比例。我们随机选择训练/测试分割,并重复评估5次,并对性能进行平均。6.4. 评估指标在UCF-Crime数据集上,我们遵循官方评估协议,报告AUC以及误报率。对于其他数据集,我们使用F1得分来反映我们分类模型的敏感性和准确性。由于我们使用的数据集-特别是Dash-Cam-Pose -为此,我们还报 告 了 真 阴 性 率 TNR=TN , 阴 性 预 测 值 NPV=TN ,F1=2×TNR×NPV以及标准F1评分。6.5. 消融研究合成实验:为了深入了解我们方案的内部工作原理,我们在几个2D合成玩具数据集上展示了结果。在图4中,我们显示了四个图,(a) BODS-高斯(b)GODS-高斯 (c)GODS-任意图4. BODS(最左边)和GODS在各种数据分布上找到的子空间的可视化。100个点分布为(i)高斯分布和(ii)任意分布5。我们在第一个图中显示了BODS超平面,其余两个图显示了GODS 2D子空间,属于每个子空间的超平面以相同的颜色显示。如图所示,我们的模型能够定向子空间,使它们将数据限制在最小体积内。更多的结果在柔软的材料中提供。参数研究:在图5中,我们绘制了增加超平面数量对四个数据集的影响。我们发现,在一定数量的超平面后,性能饱和,这是预期的,并表明更多的超平面可能会导致过度拟合的积极类。我们还发现,当使用我们提出的方法时,在Dash-Cam- Pose数据集上,TCN嵌入明显优于BoW模型(近3%)。令人惊讶的是,S-SVDD被发现表现相当不如我们的;注意,该方案学习低维子空间以将数据投影到(如在PCA中),并在该子空间上应用SVDD。我们认为,这些子空间可能是共同的负面点,以及它不能适当地区分,导致性能不佳。我们对其他数据集也进行了类似的观察。6.6. 最新技术水平比较在表2中,我们将我们的变体与最先进的方法进行了比较。如前所述,对于我们的Dash-Cam-Pose数据集,由于其正类和负类是不平衡的,我们采用报告负集上的F1从表中可以清楚地看出,我们的变体优于之前的方法-5数据遵循公式f(x)=x(x+sign(randn)rand),其中randn和rand是标准MATLAB函数。82090.70.650.60.60.50.40.30.80.750.70.650.80.750.70.650.551 2 3 4 5 6 7 8 9 100.21 2 3 4 5 6 7 8 9 100.61 2 3 4 5 6 7 8 9 100.61 2 3 4 5 6 7 8 9 10超通道数量(a) UCF-犯罪超通道数量(b) 破折号凸轮式超通道数量(c) JHMDB超通道数量(d) 声纳图5.我们的方法在越来越多的子空间的各种数据集上的性能表2.四个数据集的平均性能,其中Dash-Cam-Pose使用F1分数,而其余的使用F1分数作为评估指标(分类准确性显示在括号中)。K-OC-SVM和K-SVDD是RBF核化变体。方法仪表盘-凸轮-姿势弓仪表盘-凸轮-姿态TCNJHMDB声纳泵OC-SVM [46]0.167(0.517)0.279(0.527)0.301(0.568)0.578(0.459)0.623(0.482)SVDD [51]0.448(0.489)0.477(0.482)0.407(0.566)0.605(0.479)0.813(0.516)[46]第四十六话0.327(0.495)0.361(0.491)0.562(0.412)0.565(0.429)0.601(0.499)K-SVDD [51]0.476(0.477)0.489(0.505)0.209(0.441)0.585(0.474)0.809(0.529)K-PCA [20]0.145(0.502)0.258(0.492)0.245(0.557)0.530(0.426)0.611(0.416)Slab SVM [18]0.468(0.568)0.498(0.577)0.643(0.637)0.600(0.619)0.809(0.621)LS-OSVM [14]0.234(0.440)0.246(0.460)0.663(0.582)0.643(0.466)0.831(0.448)S-SVDD [49]0.325(0.490)0.464(0.500)0.642(0.498)0.637(0.500)0.865(0.500)BODS0.523(0.582)0.532(0.579)0.725(0.714)0.677(0.662)0.823(0.714)神0.553(0.629)0.584(0.601)0.777(0.752)0.762(0.775)0.892(0.755)1210864201 10 20 305080100200数据集是平衡的,我们报告F1分数。总的来说,实验清楚地证实了我们的方法在单类任务上提供的性能优势。在图6中,我们展示了训练不同模型的时间消耗可以看出,GODS BODS算法在计算上并不比其他方法昂贵,而在经验上更优越(表2)。在表3中,我们展示了与现有技术训练样本数量(以百为单位)图6.随着训练样本数量的增加,每种方法的训练时间方法AUC虚警率随机50.00-哈桑等人[19个]50.6027.2Lu等人[35]第三十五届65.513.1WagnerWaqas等人[50个]75.411.9Sohrab等人[49个]58.5010.5BODS68.262.7神70.462.1表3.在UCF-Crime数据集上的表现安装程序不同。消耗臭氧层物质占相当大的比例。例如,使用TCN,GODS比OC-SVM好30%以上;甚至我们也比内核化的变体高出大约20%。类似地,在JHMDB和其他两个数据集上,GODS比次优方法好约3- 13%,分类精度显著提高(超过10%)。 作为测试集中使用的类,TCN弓神S-SVDDGODSS-SVDDGODSS-SVDDGODSS-SVDD神体最小二乘支持向量机Slab-SVMAUC培训时间(秒)F1F1F18210使用AUC指标和误报率(我们使用50%的标准阈值)对UCF-Crime数据集进行分析。虽然我们的结果低于[50],但他们的问题设置与我们的完全不同,因为他们在训练中也使用弱标记的异常视频,我们不使用这些视频,并且根据定义,这不是一类问题。因此,我们的结果是无法与他们相比的。在这个数据集的其他方法上,我们的方法大约好5-20%。7. 结论在本文中,我们提出了一种新的一类学习公式,使用子空间在一个歧视性的设置,这些子空间是以这样一种方式,以夹层的数据。由于非线性约束的优化问题,我们投在黎曼条件下的目标,然而,我们推导出有效的数值解。在五个数据集的不同集合上进行的实验8211引用[1] P-A Absil , Robert Mahony , and RodolpheSepulchre. 矩阵流形上的优化算法。普林斯顿大学出版社,2009. 二、五[2] 阿米特·亚当,埃胡德·里夫林,伊兰·希姆肖尼,和达-维夫·雷尼茨.使用多个固定位置监视器进行稳健的实时异常事件检测。IEEE trans-actions onpattern analysis and machine intelligence , 30(3):555-560,2008。3[3] Mykhaylo Andriluka , Leonid Pishchulin , PeterGehler,and Bernt Schiele. 2D人体姿势估计:新基准和最新分析。InICCV,2014.6[4] 克里斯托弗·M·毕晓普。新颖性检测和神经网络验证。IEEE Proceedings-Vision,Image and SignalProcessing,141(4):217-222,1994. 1[5] PaulBodesheim , AlexanderFreytag , ErikRoxley,Michael Kemmler,and Joachim Denzler.新颖性检测的核零空间方法。在CVPR,第3374-3381页,2013年。3[6] 威廉·布斯比一个介绍可扩展的流形和黎曼几何,体积120. 学术出版社,1986年。2[7] EmmanuelJCande`s , XiaodongLi , YiMa ,andJohnWright. 稳 健 主 成 分 分 析 Jour- nal of theACM(JACM),58(3):11,2011. 3[8] 曹哲、托马斯·西蒙、魏世恩和亚瑟·谢赫。利用局部亲和场进行实时多人2d姿态估计。arXiv预印本arXiv:1611.08050,2016年。二、六[9] Joao Carreira和Andrew Zisserman。你好,动作识别?新模型和动力学数据集。在CVPR中,第4724-4733页。IEEE,2017年。7[10] Raghavendra Chalapathy,Aditya Krishna Menon和Sanjay Chawla。使用单类神经网络的异常检测。arXiv预印本arXiv:1802.06360,2018。3[11] V ala,A Banerjee,和V Kumar.异常检测:一项调查,ACM计算调查。明尼苏达大学,2009年。一、二、三[12] 筑濑靖子特殊流形的统计,第174卷。SpringerScience Business Media,2012. 4[13] 崔明镇,安东尼奥·托拉尔巴,艾伦·S·威尔斯基.上下文模型和上下文外对象。Pat-tern RecognitionLetters,33(7):853-862,2012. 3[14] 崔 英 植最 小 二 乘 一 类 支 持 向 量 机 。 PatternRecognition Letters,30(13):1236-1240,2009.一、三、八[15] 费尔南多·德·拉·托瑞和迈克尔·J·布莱克。鲁棒子空间学习框架。IJCV,54(1- 3):117-142,2003. 3[16] Stefan M Duma,Tyler A Kress,David J Porta,Charles D Woods,John N Snider,Peter M Fuller和Rod J Simmons。安全气囊引起的眼部损伤:25例报告。创伤和急性护理外科杂志,41(1):114-119,1996。6[17] 艾 伦 · 埃 德 尔 · 曼 , 托 玛 的 A· 阿 里 亚 斯 , 和圣·弗·T·史密斯。具有正交约束的算法的几何。SIAMJournalonMatrixAnalysisandAppli-cations,20(2):303-353,1998. 2[18] Victor Fragoso,Walter Scheirer,Joao Hespanha,and Matt
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功