尺度空间与分类器结合的行人检测器设计

91 浏览量更新于2024-01-18 收藏 1.43MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报结合尺度空间和分类器的行人检测器设计Amlan Jyoti Dasa，Mr.，Navajit Saikiaba部。电子和通信工程，高哈蒂大学，Guwahati 781014，印度b部阿萨姆工程学院，电子和电信工程，Guwahati 781013，印度阿提奇莱因福奥文章历史记录：收到2019年2019年5月18日修订2019年6月28日接受在线预订2019年保留字：行人检测非线性尺度空间线性支持向量机两阶段分类A B S T R A C T随着人们对监控应用需求的不断增长，行人检测成为近年来研究的热点。行人检测器的质量取决于检测精度和检测率。本文提出了新的行人检测器的基础上两种类型的分类器，线性支持向量机和级联的提升分类器。这些分类器是通过使用一个特征集，包括直方图的方向梯度和密集的局部差异二进制特征进行训练图像金字塔和非线性尺度空间都被用来检测各种大小的行人。为了结合两个分类器的优点，一个新的两阶段检测方案也提出了。建议的检测器的检测精度进行了研究，在每幅图像的误检率与假阳性和误检率与假阳性每个窗口。检测器的性能也与现有的类似类型的检测器的性能进行了比较©2019作者（S）。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍基于视觉的行人检测由于服装、姿态和光照的变化而具有挑战性。近年来，由于其在基于监控的安全和安全应用中的需求，它一直是一个重要的研究课题。实时行人检测器的质量取决于检测精度和速度（Dollar等人，2010年）。虽然期望高精度，但是像车辆安全、监视等的实时应用也主要需要快速检测速率（Dollar等人， 2010年）。基于图像或分类器金字塔的多尺度检测用于检测可变尺寸的行人（Dollar等人，2010年）。图像金字塔是通过将图像线性地下采样为一系列倍频程或金字塔级别来构造的，其中在下采样之前普遍使用高斯滤波。这增加了模糊的金字塔水平的进展，往往导致错误分类的大型行人。在Yi and Xue（2014）中使用非线性尺度空间解决了这个问题。分类器金字塔改变了*通讯作者。电子邮件地址：amlandas78@gmail.com（A.J. Das）。沙特国王大学负责同行审查制作和主办：Elsevier在训练期间的检测窗口需要选择适当的比例因子。因此，每个窗口大小都需要一个特定的训练模型。行人探测器大致分为两种类型：手工制作和基于数据驱动的特征（Wang和Zhang，2015）。在第一种方法中，提取具有鉴别力和鲁棒性的特征以及选择强大的学习算法进行分类是两个关键方面。随着计算能力的提高和大量数据的可用性，人们也在考虑不需要手工制作特征的数据驱动的基于特征的方法（Wang和Zhang，2015）。然而，需要具有高处理能力的专用硬件，在这里，高训练时间是限制。因此，手工制作的基于特征的行人检测器仍然在研究人员中继续流行（Ardiyanto等人， 2018年）。本文的其余部分组织如下：第2节介绍了相关的行人检测系统的简要文献综述。第三节讨论了相关的理论问题第4第7节提出了一个性能比较的建议检测器与现有的行人检测器。第8节结束了论文。2. 相关作品近年来，行人检测在检测精度和速度方面已经有了显著的提高（Dollarhttps://doi.org/10.1016/j.jksuci.2019.06.0171319-1578/©2019作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comA.J. 达斯河Saikia/ Journal of King Saud University1211例如，2012年）。许多提出的技术都是用标准的行人数据集进行测试的，如INRIA（Dalal和Triggs，2005年），Caltech-USA（Dollar等人，2009）等。如第1节所述，基于手工特征的行人检测器的检测精度和速度主要取决于特征和分类器的选择。HOG（Dalal和Triggs，2005）、基于通道的特征（Dollar 等人，2009 ）、基于纹理的特征（ Wang等人，2009）、Haar样特征（Viola和Jones，2004）等。其中，HOG及其变体（Zhu等人，2006;Watanabe等人，2008）已经流行（Baek等人，2017年）。积分HOG特征（Zhu等人，2006）使用积分直方图来获得更快的计算。人们还使用不同特征的组合（Wang等人，2009; Wojek等人，2008; Walk等人，2010; Das和Saikia，2016）和基于部件的模型（Felzenszwalb等人，2010年，取得更好的成绩。例如，（Wojek等人， 2008 ）使用了 Haar 样特征、 sha- pelets （ Sabzmeganani 和Mori，2007）和形状上下文（Mori等人，2005年，以猪？在Walk等人（2010）中，使用了关于颜色自相似性的运动特征和区域信息以及HOG。局部二进制模式（LBP）（Ojala等人，2002）与HOG一起应用于（Wang等人，2009年）。在Das和Saikia（2016）中，使用了密集局部差分二进制（密集LDB）特征和HOG。同样，给定一组特征，分类器应该具有良好的学习和区分能力。一些流行的分类器包括支持向量机（SVM）（Dalal和Triggs，2005）、boosted（Viola和Jones，2004）、决策森林（Tang等人， 2012）及其变体（Maji et al.，2008;Felzenszwalb等人，2010; Dollar等人，2009年）。其中，SVM和提升分类器由于其速度而优选（Dollar等人，2012年）。人们还使用级联的提升分类器来提高检测速度（Viola和Zhang，2007; Baek等人，2017年）。人们还考虑两阶段分类，两个分类器的优点，以实现更好的检测性能（ Geismann 和Schneider ， 2008 年 ;Møgelmose 等人， 2012;Guo 等人， 2012年）。第二阶段（假设验证）中的分类器被提供有从第一阶段（假设生成）导出的潜在行人候选，以最小化误报的数量为了实现更好的整体检测速度，处理所有检测窗口的第一阶段中的分类器通常，在第一阶段中使用级联的提升分类器，这是由于其比线性SVM有效地拒绝非行人窗口的固有能力（Guo等人， 2012年）。在第二阶段，人们使用线性SVM，因为它可以准确地分类高维数据（Trivedi和Dey，2013）。虽然Geismann和Schneider（2008）使用了提升和SVM分类器的组合，但在Møgelmose等人中采用了提升和基于部分的SVM分类器。（ 2012年）。如第1节中所讨论的，使用图像金字塔进行多尺度检测会在更高的金字塔级别上产生模糊图像，这可能导致误分类。此外，Yi和Xue（2014）通过非线性尺度空间解决了这一限制，该非线性尺度空间使用基于局部图像结构的自适应核大小的扩散滤波器。它表明，非线性尺度空间可以保持显着的边界，即使在深金字塔的水平，使更大的对象可以被检测到更强大。总而言之，可以提出以下意见：i. 线性支持向量机的优越性能和级联提升分类器的计算效率一直吸引着许多研究者。ii. 将梯度和纹理信息一起考虑在特征集中得到图像内容的更好表示。iii. 非线性尺度空间有助于在更高的金字塔级包含重要的边界。考虑到这些观察结果，我们集中在以下方面进行开发：i. 行人检测器使用图像金字塔和非线性尺度空间，线性SVM分类器使用基于梯度和纹理的特征。ii. 行人检测器使用图像金字塔和非线性尺度空间，并使用梯度和基于纹理的特征级联提升分类器iii. 行人检测器具有两个阶段的分类，在第一阶段中的提升分类器的级联和在第二阶段中的线性SVM。图像金字塔和非线性尺度空间的组合将被应用。将使用基于梯度和纹理的特征的组合集。第三部分简要介绍了相关理论。3. 相关理论本部分简要介绍了相关的理论方面。它还介绍了可供查阅的文献，以了解进一步的细节。3.1. HOG和密集LDB描述符HOG描述符：边缘特征在行人检测中很重要，因为它们可以很好地表示对象边界，并且通常对光照，颜色和纹理不敏感梯度幅度与方向一起可以表示行人或物体的局部边缘或形状和外观（Dalal和Triggs，2005）。期望特征对于行人外观的局部变化是鲁棒的。在Dalal和Triggs（2005）中，Dalal和Triggs基于局部强度梯度方向的分布引入了用于行人检测的HOG特征，以表示检测窗口内的局部形状和外观。由于边缘强度的方向直方图是在局部区域（称为“单元”）中计算的局部光照变化、局部阴影和前景-背景对比度是行人检测中的一些重要挑战，这些挑战在HOG中通过对比度归一化一组单元（称为“块”）来内在地在Dalal和Triggs（2005）中详细介绍了HOG描述符的计算。密集LDB描述符：基于梯度的特征无法区分属于不同局部模式的具有相似梯度的像素，并且由于噪声，在杂乱环境中表现不佳（Das和Saikia，2016）。Das和Saikia（2016）通过将HOG与密集LDB描述符相结合来克服这些限制，密集LDB描述符是基于模式的局部差异二进制（LDB）描述符的修改版本（Yang和Cheng，2012）。密集LDB基本上对块内的成对局部单元执行平均强度和区域梯度的差异测试以导出二进制描述符。平均强度和区域梯度的考虑消除了噪声的影响。从检测窗口中的多个重叠块获得的二进制描述符的组合获得该窗口的密集LDB描述符。Das和Saikia（2016）讨论了密集LDB的细节。3.2. 图像金字塔从第1节，行人检测器通常考虑多尺度检测通过使用分类器金字塔或图像金字塔来检测图像中的可变大小的对象。分类器金字塔使用不同尺度的不同大小的窗口，1212A.J. 达斯河Saikia/ Journal of King Saud UniversityRðÞ×××**--R×每个窗口的特定训练模型，并适当选择比例因子。在图像金字塔中，原始图像被反复滤波和下采样以生成金字塔级的图像，并且在每一级使用固定大小的滑动窗口进行检测。虽然分类器金字塔的使用产生更快的检测，但是尺度不变特征的需要在这里是限制，因为包括HOG的许多流行特征不是尺度不变的（Dollar等人，2010年）。因此，通常选择图像金字塔。图像金字塔的构造在Dollar et al.（2010）、Yi和Xue（2014）、Dollar等人（2012）。图像金字塔的一个缺点是，由于在下采样之前使用高斯滤波，它导致随着倍频程级别的增加而增加的模糊这可以通过非线性尺度空间来解决（Yi和Xue，2014）。3.3. 非线性尺度空间这里，在金字塔级别，根据局部图像结构在不同像素处采用不同核大小的非线性扩散滤波器（Alcantarilla等人，2013年）的报告。在较大的梯度像素处，核大小变得较小，使得较大对象的边缘也可以在深金字塔级别上被保留（Yi和Xue，2014）。给定图像I x;y，经典的非线性扩散方程由Alcantarilla等人给出。（2013年）：@L@t¼divcx;y;t：rL1其中div和分别是发散和梯度操作器，L是图像发光强度，t是尺度参数，c是局部自适应扩散的传导函数。我们考虑Weickert电导率函数，因为它强烈地平滑边缘的两侧而不是穿过它，根据：81;jrLrj2¼084.1. 系统描述图像金字塔和非线性尺度空间的创建：缩放因子的选择在多尺度表示中是关键的（Dollar等人，2012年），并在此确定。图像金字塔是根据Das和Saikia（2016）构建的。在针对从1.03到1.1的范围内的各种比例因子测试检测器性能之后，在最终实现中考虑的比例因子为1.04。为了保持检测精度和速度，一旦图像金字塔中的下采样图像的尺寸小于或等于原始尺寸的一半，就考虑非线性尺度空间。此外，如第3节所述，其结构适用于FED方案和Weickert扩散率函数的优点，如第3节所述。通过实验确定了倍频程级数和子级数分别为7和4。在1.03至1.4的范围内的各种比例因子的检测器性能进行计算，并观察到最佳性能在1.3，这是这里考虑的。HOG和密集LDB特征的计算：Das和Saikia（2016）中提出的HOG和密集LDB特征的组合也用于这项工作，并根据Das和Saikia（2016）进行计算。因此，对于HOG和密集LDB，检测窗口大小为64128像素，单元格大小为88像素，以及块大小为2 2个单元。HOG使用9个方向箱，并应用L2-Hys对半重叠块的局部响应进行对比度归一化。在密集LDB中也考虑半重叠块以密集地捕获图案信息。导出的组合特征描述符的大小为5670每窗口，包括3780 HOG和1890密集LDB功能。线性SVM分类器：本文提出的所有检测器都使用INRIA行人数据集，该数据集包含614个阳性和1218个阴性训练图像以及288个阳性和588个阴性测试图像。对614幅正训练图像中的1208个注释行人窗口进行镜像，以生成2416幅正训练图像。用于训练的样本。对于阴性训练样本，12180c3x;y;t=1exp3：315;jrLrjrLr>0分2秒从1218个负训练样本中随机抽取窗口图像.硬底片（Dalal和Triggs，2005年）提取后，其中Lr是高斯平滑L的梯度，k是控制扩散水平的对比因子。方程的近似解。（1）可以通过用快速显式扩散（FED）将其离散化来获得（Grewenig等人， 2010 ），其结合了显式和半隐式方案的益处（Alcantarilla等人， 2013年）的报告。Alcantarilla等人（2013）解释了使用FED创建非线性尺度空间。这里要注意的是，可以根据经验考虑任何比例因子（除了Alcantarilla等人（ 2013 ）中考虑的 2 ），并且应相应地解决 Alcantarilla 等人（2013）中提出的算法。下一节提出了一种新的基于线性SVM的行人检测器，它结合了HOG和密集LDB特征，同时应用了图像金字塔和非线性尺度空间。4. 行人检测：拟议的系统-1对于多尺度检测，图1中提出的系统使用非线性尺度空间和图像金字塔，即使在较小的下采样图像中也能保留边缘，同时检测较大的对象（Yi和Xue，2014）。HOG和密集LDB特征如Das和Saikia（2016）中所使用。选择线性SVM分类器是因为其计算简单性和可比性能（Maji等人， 2008年）。与（Das和Saikia，2016）不同，由于非线性尺度空间而导出的硬否定（Dalal和Triggs，2005）也用于训练分类器。下面描述图1中的各种每个训练阶段通过使用图像金字塔和非线性尺度空间，并且被添加到负训练集以执行下一阶段的训练。SVM分类器迭代训练6个阶段，这是实验决定其最佳性能。经训练的分类器用于分别检测图像金字塔和非线性尺度空间中的行人，然后进行非最大抑制（Dollar等人，2012），以得出最终输出。实验观察结果如下。4.2. 实验结果在这项工作中提出的所有检测器的性能进行了研究的失误率与。每窗口假阳性（FPPW）（Dollar等人， 2012年）和未命中率与每图像假阳性（FPPI）（Dollar等人， 2012年）。为了测试每个窗口的性能，我们考虑了行人1176个窗口，包括288个正测试图像及其镜像中的588个行人窗口图中的绿色和红色曲线。 5 a分别显示了所提出的检测器和Das和Saikia（2016）中的检测器的每窗口性能。在每图像性能评价中，PASCAL标准（Dollar等人，2012）用于处理部分检测。检测窗口在每个图像上从左上到右下滑动，在每个级别的尺度空间上具有8 - 8像素的固定步长。图中的绿色和红色曲线。 5 b分别显示了申报探测器和Das和Saikia（2016）中探测器的每幅图像性能。2A.J. 达斯河Saikia/ Journal of King Saud University1213×Fig. 1. 拟定系统框图-1。图二. 拟议系统的框图-2。图三. (a)每个级联级的弱分类器（b）每个级联级的累积拒绝率。从图中可以看出。 5 a，所提出的检测器具有在10- 4 FPPW时，未命中率为11%，比（Das和Saikia，2016）中的探测器好约1%。此外，图5b示出了所提出的探测器在1 FPPI下的缺失率约为12%，在0.1 FPPI下的缺失率约为37%，对数平均缺失率为37.2%，对应于Das 和Saikia（2016）中探测器的17%、41%和41%。改进的性能是由于使用非线性尺度空间，使得能够在更高的金字塔级别正确检测更大的然而，所提出的探测器需要4.2 s处理一帧大小为640 480像素的图像，比Das和Saikia（2016）所需的时间多1.7 s。更高的计算时间是由于两个因素：（i）除了图像金字塔之外，非线性尺度空间的构造，（ii）线性SVM分类器，其包括计算这些附加图像中的检测窗口的完整特征向量提升分类器的级联比SVM工作得更快，因为它在其早期拒绝阶段使用更少的特征（Zhu等人，2006年）。在下文中，我们建议使用级联的提升分类器。此外，为了更快的特征计算，考虑积分HOG而不是HOG（Zhu等人， 2006年）。5. 行人检测：拟议的系统-2图2中所提出的系统在两个方面与前一个不同。（i）提升分类器的级联取代了线性分类器，1214A.J. 达斯河Saikia/ Journal of King Saud University××见图4。拟议系统3的系统框图。EARSVM减少了每个窗口要计算的特征的平均数量，因为在其早期拒绝阶段使用较少的特征（Zhu等人，2006年）。(ii)积分HOG代替传统的HOG，加快了特征计算。它还促进了可变大小块的使用，以更好地捕获有用的模式和足的语义部分（Zhu等人，2006年）。这两个部件在图2中，在下面进行描述。5.1. 系统描述积分HOG的计算：积分HOG的计算在Zhu等人（2006）中详细介绍。根据Zhu et al. （2006），在提升分类器的级联中的早期拒绝阶段不能仅用大小为16 × 16像素的块有效地实现，因为它们可能不提供完整检测窗口的全局特征这在Zhu et al. （2006）通过使用可变大小的块。在这项工作中，它是实验决定使用可变大小的块的大小从8× 8到32× 64像素在64 128检测窗口中，纵横比为1：1、1：2和2：1。此外，基于实验使用步长4。由此导出的每个窗口的块的总数是1534。每个块的特征数量为54，其中36个是整体HOG特征，18个是密集LDB特征。级联分类器的训练：级联分类器的设计和训练涉及特征选择和通过Ada-boost算法（Viola和Jones，2004）进行学习。我们使用深度2决策树作为弱分类器，以获得满足质量要求的每个级联级的强分类器，每个级联级的最小可接受检测和每个级联级的最大误报（Viola和Jones，2004）。实验上分别将它们设置为0.9975和0.3。给定一个窗口，计算可变大小块的积分HOG和密集LDB特征。该分类器经过21个级联阶段的训练，使用2.4 GHz CPU和8 GB内存，耗时约3周。这样得到的最终分类器有446个弱分类器分布在级联级中，如图1所示。 3 a. 阶段阈值为A.J. 达斯河Saikia/ Journal of King Saud University1215××图五. Das和Saikia（2016年）中申报系统-1、申报系统-2、申报系统-3和检测器的性能比较（a）未命中率与FPPW（b）未命中率与FPPW（c）未命中率与FPPW（d）未命中率与FPPW（e）未命中率与FPPW FPPI。见图6。所提出的检测器的精确度与召回率特性。在训练期间计算级联阶段（Viola和Jones，2004），以决定窗口是否足够强以进行到下一阶段。5.2. 实验结果测试图像来源于第4节所述的INRIA数据集。图5a和b中的蓝色曲线分别显示了每个窗口和每个图像的性能。从图5a，亲-在10- 4FPPW时，姿态探测器的误检率为8.4%，比系统1的误检率提高了2.6%。检查未命中率与FPPI性能、图像金字塔和非线性尺度空间的创建如第4节所述。在图像金字塔的情况下，当比例因子为1.05时观察到最佳检测率，1.30在非线性尺度空间中。图5b示出了检测器在1 FPPI处实现了约13%的未命中率，并且在2 FPPI处实现了37%的未命中率。0.1 FPPI ，对数平均漏诊率为 37.4% 。虽然每图像性能略低于System-1，这里值得注意的成就是如所期望的更好的计算速度。图3b示出了在分类器的不同阶段的累积拒绝率。可以注意到，涉及级联的25个弱分类器的前3级拒绝大约95%的负窗口。这有助于实现检测时间0.38秒的大小为640 - 480像素的图像和13左右的速度相比，所提出的系统-1。从上面可以观察到，尽管基于线性SVM的检测器具有更好的每图像性能，但是基于级联的检测器明显更快。因此，我们考虑结合级联分类器的计算速度和线性支持向量机的鲁棒性来开发一个两阶段检测器。6. 行人检测：拟议的系统-3图4所示的两级检测器使用级联在假设生成阶段采用提升分类器，在假设验证阶段采用线性支持向量机。如第2节所述，1216A.J. 达斯河Saikia/ Journal of King Saud University×提升分类器的级联可以在早期拒绝阶段以更快的方式拒绝大多数非行人候选（Guo等人，2012年）。线性SVM具有通过训练计算最大间隔平面来准确分类高维数据的能力（Trivedi和Dey，2013）。这里，如果第一阶段生成的行人候选被第二阶段验证为行人，则这是肯定的检测。这里分别使用第5节和第4第4节中的线性SVM中的计算穷举在这里被显著降低，因为它只需要对从假设生成阶段导出的较少数量的行人候选进行分类。级联分类器中的级数要被选择为使得其导出假设中潜在行人的最大数目和假阳性的最小数目这种权衡对于线性SVM在检测精度和速度方面的性能是重要的线性SVM需要关于每个潜在候选者的以下信息，以将其从对应的金字塔级中提取出来用于计算特征：(1)从其检测候选的多尺度表示（图像金字塔或非线性尺度空间），（2）金字塔级（以及在非线性尺度空间的情况下的子级），以及（3）其在图像中在金字塔级的位置图5a和b中的紫色曲线分别表示所提出的系统-3的每个窗口和每个图像性能。从图5a中可以看出，它在10- 4 FPPW时的失误率为8%，比建议的系统-1（第4节）和系统-2（第4节）分别好3%和3%。（5）0.4%。实验观察到，如图5b所示，在级联分类器中具有5个级的系统-3获得最佳的每图像性能。在1和0.1 FPPI时的未命中率分别约为10%和32%。计算出的对数平均误检率为32.3%，System-3处理时间约为0.35 s大小为640 × 480像素的帧，其在所提出的系统中是最小的。同样，图6呈现了所提出的检测器的精确度与召回率性能。System-3在所有精度值下提供更好的召回。例如，与System-1和System-2相比，System-3在0：625的精度水平下观察到召回率提高了2.2%。此外，对应于0.885的召回值，System-3显示出4.5%的精度提高如第2节和第3.3节所讨论的，使用非线性尺度空间应该可以提高对大型行人的检测。因此，所提出的系统的性能也研究了在行人大小方面测试图像中的行人根据行人身高分为3类：（0-33.33百分位数）、中等（33.34-66.67百分位数）和大（66.68-100百分位数）。每组的检出百分比在1 FPPI和0.1 FPPI下的平均值分别在图7a和b中示出。Das和Saikia（2016）中的检测器的性能与所提出的System-1相似，但不使用非线性尺度空间，也包括在内，以显示非线性尺度空间在检测大型行人。这些图表明，所有提出的检测器都比Das和Saikia（2016）中的检测器性能更好，特别是对于大型行人和中型行人。这里要注意的是，所提出的系统-3对中等和大尺寸的行人表现最好。所有提出的检测器具有相似的性能，为小尺寸的行人。7. 比较研究建议的行人检测器与现有的类似的检测器，使用INRIA数据集的比较1。考虑到所提出的系统的架构，现有的检测器与支持向量机或级联的提升分类器在Viola Jones的目标检测框架被认为是在这里进行比较。所提出的系统-3在1 FPPI时的误检率为10%，优于所有其他检测器。然而，该检测器在0.1 FPPI时的%未命中率为32，比Walk等人（2010）报告的略高（7%）。所提出的系统-1和系统-2在1 FPPI时的未命中率分别为12%和13%，这与Walk等人（2010）和Bar-Hillel等人（2010）中的其他性能良好的探测器相当。然而，它们在0.1 FPPI时具有更高的未命中率。如第1节所述，检测率是实时行人检测中的另一个重要方面。据观察，拟议的系统-1大约慢2倍，系统-2比Dalal和Triggs（2005）中的检测器快 5.75 倍。拟议的 System-3 被发现比 Dalal 和 Triggs（2005）的检测器快6.57倍。根据Dollar等人的研究， 2012年，Walk等人（2010年）和Bar-Hillel等人（2012年）中的检测器。（2010）比Dalal和Triggs，2005慢。由于Walk等人（2010）中的检测器慢8.85倍，System-3比Walk等人（2010）中的检测器快约58倍。因此，与Walk等人（2010）和Bar-Hillel等人（2010）中的检测器相比，它具有更好的实时应用范围，尽管其检测精度略低，为0.1 FPPI。因此，所提出的系统-3提供了检测精度和检测速率之间的更好的折衷。见图7。在（a）1和（b）0.1 FPPI时不同行人高度的检测百分比。A.J. 达斯河Saikia/ Journal of King Saud University1217表1不同行人探测器的比较。检测器特征分类器%未命中率1 FPPI0.1 FPPI02 The Dog（2004）HaarAdaBoost4872Dollar et al. （二零零七年）HOG，颜色AdaBoost315805 The Dog（2005）生猪线性SVM234603 The Dog（2007）梯度AdaBoost5082Wojek等人（二零零八年）哈尔·豪格线性SVM1636Walk等人（二零一零年）HOG、CSSAdaBoost1225Maji等人（二零零八年）生猪线性SVM2443Bar-Hillel等人（2010年）HOG，纹理线性SVM1231Wang等人（二零零九年）猪，LBP线性SVM1939Baek等人（2017年）生猪AKSVM1533Das和Saikia（2016）HOG，致密LDB线性SVM1741系统-1HOG，致密LDB线性SVM1237系统-2积分HOGAdaBoost1337系统-3稠密LDBHOG/积分HOG，AdaBoost1032稠密LDB线性SVM8. 结论行人检测器的普及随着基于监控的应用的使用的增加而增长本文提出了三种基于梯度和纹理特征相结合以及图像金字塔和非线性尺度空间相结合的行人检测方法线性支持向量机和级联的提升分类器已被用来设计的检测器。所提出的检测器的检测性能进行了研究与INRIA行人数据集，并与现有的类似检测器的性能进行了比较从比较中，已经观察到，所提出的两级检测器在1 FPPI处提供最佳检测性能，并且在0.1 FPPI处提供相当的性能。还观察到，该检测器具有适合于实时应用的检测率。我们未来的工作将包括使用基于深度学习的方法进行行人检测，以及开发行人检测器来处理白天和夜间使用的多光谱行人候选人。竞争利益一个也没有。确认这项工作得到了印度政府科学和技术部在INSPIRE研究金方案下的支持。引用Alcantarilla，P.F.，Nuevo，J.，Bartoli，A.，2013.非线性尺度空间中加速特征的快速显式扩散。在：英国机器视觉会议论文集。Press.阿迪扬托岛Adji，T. B.，阿斯马拉曼检察官，2018.基于形状特征的行人检测学习算法综合分析。J. Intell。模糊系统（预印本），1-14。Baek，J.，金，J.，Kim，E.，2017.通过级联实现的加性核支持向量机快速有效的行人检测。IEEE传输接口运输单18（4），902-916。Bar-Hillel，A.，Levi，D.，Krupka，E.，Goldberg，C.，2010年。基于零件的人体检测特征合成。计算机视觉 - ECCV 2010 。Springer ， Berlin Heidelberg ， Berlin ，Heidelberg，pp. 127比142Dalal，N.，Triggs，B.，2005.用于人体检测的定向梯度直方图。2005年IEEE计算机协会计算机视觉和模式识别会议（CVPR'05），第1卷，第110页。 886- 893达斯，A.J.，Saikia，N.，2016年。结合hog的密集LDB描述子行人检测。国际信息技术会议（InCITe）2016，299-304。Dollar，P.，Tu，Z.，陶，H.，贝隆吉，S.，2007年图像分类的特征挖掘IEEE计算机视觉与模式识别会议2007，1Dollar，P.，沃杰克角，Schiele，B.，佩罗纳山口，巴西-地2009.行人检测：一个基准。IEEE计算机视觉与模式识别会议2009，304Dollar，P.，Tu，Z.，佩罗纳山口，巴西-地贝隆吉，S.，2009.完整的通道功能。在：英国机器视觉会议论文集。BMVA Press，pp. 91.1- 91.11Dollar，P.，贝隆吉，S.，佩罗纳山口，巴西-地2010年。西部最快的行人探测器在：英国机器视觉会议论文集。BMVA Press，pp. 68.1- 68.11。Dollar，P.，沃杰克角，Schiele，B.，佩罗纳山口，巴西-地2012.行人检测：对最新技术的评价。IEEE Trans.模式肛门。马赫内特尔 34（4），743-761。Felzenszwalb，P.F.，Girshick，R.B.，McAllester，D.，拉马南，D.，2010.使用区分训练的基于部分的模型进行目标检测。 IEEE Trans. 模式肛门。马赫内特尔32（9），1627-1645。Geismann，P.，Schneider，G.，2008.基于haar和hog特征的两阶段行人视觉识别方法。IEEE Intell. Veh. Symp. 2008，554-559.Grewenig，S.，Weickert，J.，Bruhn，A.，2010.从箱式滤波到快速显式扩散。在：模式识别.Springer，Berlin Heidelberg，Berlin，Heidelberg，pp. 533-542.Guo，L.，中国科学院，Ge，P.-美国，张曼- H、李湖，澳-地H、赵玉B、2012.结合adaboost算法与支持向量机的智能交通系统行人检测。专家系统Appl.39（4），4274-4286。Maji，S.，伯格，AC，Malik，J.，2008.使用交集核支持向量机的分类是有效的。IEEE计算机视觉与模式识别会议2008，1-8。Møgelmose，A.，Prioletti，A.，Trivedi，M.M.，Broggi，A.，Moeslund，T. B.，2012.两阶段基于部分的行人检测。2012年第15届IEEE智能交通系统国际会议，pp。 73比77Mori，G.，贝隆吉，S.，Malik，J.，2005.使用形状上下文的高效形状匹配。IEEE传输模式分析马赫内特尔27（11），1832-1837。Ojala，T.，Pietikainen，M.，Maenpaa，T.，2002.基于局部二值模式的多分辨率灰度和旋转不变纹理分类。IEEE传输模式分析马赫内特尔24（7），971-987。Sabzmeganani，P.，Mori，G.，2007.通过学习shapelet特征检测行人。IEEE计算机视觉与模式识别会议2007，1-8。唐，D.，Liu，Y.，金，T.- K.，2012.基于主导方向模板的级联随机森林快速行人检测。BMVC。Trivedi，S.K.，Dey，S.，2013.文章：各种核函数和特征选择方法对检测垃圾邮件的SVM性能的影响。国际计算机Appl. 6 6 （21），18-23。Viola，P.，琼斯，M.J.，2004.鲁棒的实时人脸检测。国际计算机Vision 57（2），137-154.Viola，P.，张，C.，2007.多实例剪枝用于学习高效级联检测器。高级神经信息处理。系统、一四一七至一四二四年沃克，S.，Majer，N.，Schindler，K.，Schiele，B.，2010.行人检测的新功能和见解。IEEE计算机协会计算机视觉和模式识别会议2010，1030-1037。Wang ， L. ，美国，张， B. ， 2015. 用于行人检测的增强式深度学习， CoRRabs/1505.06800..王，X.，汉TX Yan，S.，2009.具有部分遮挡处理的hog-lbp人体检测器。2009年IEEE第12届计算机视觉国际会议，pp。 32比39渡边，T.，伊藤，S.，Yokoi，K.，2008.用于行人检测的定向梯度共生直方图。在：第三届环太平洋研讨会上的图像和视频技术的进步，PSIVT '09。Springer-Verlag，柏林，海德堡，pp. 37比471218A.J. 达斯河Saikia/ Journal of King Saud University沃杰克角，Schiele，B.，2008.单特征和多特征人物检测的性能评估。在：Rigoll，G.(Ed.)、公司简介Springer，BerlinHeidelberg，Berlin，Heidelberg，pp.82比91杨，X.，Cheng，K.- T.，2012. Ldb：移动设备上可扩展增强现实的超快特性。IEEEInternational Symposium on Mixed and AugmentedReality（ISMAR）2012，49-57.Yi，Z.，薛，J，2014.在人检测中使用非线性多尺度空间提高hog描述符的准确性。在：2014年ACM东南区域会议的会议记录，纽约，纽约，美国，pp。9：1-9：6.朱庆国，是的，MC，Cheng，K.T.，Avidan，S.，2006.使用梯度方向直方图级联的快速人体检测。2006年IEEE计算机协会计算机视觉和模式识别会议，第2卷，第103页。1491-1498年。

下载后可阅读完整内容，剩余1页未读，立即下载