自适应特征卷积网络在行人检测中的应用

需积分: 18 80 浏览量更新于2024-08-13 收藏 1.42MB PDF 举报

"基于自适应特征卷积网络的行人检测方法" 行人检测是计算机视觉领域中的一个关键任务，它涉及到在复杂环境中识别和定位人类个体。传统的行人检测方法往往依赖于手工设计的特征，如Haar特征或HOG，但这些方法在处理复杂背景和遮挡情况时效果有限。随着深度学习的兴起，尤其是卷积神经网络（CNNs）的发展，行人检测技术得到了显著提升。本文关注的是如何更有效地利用CNN的浅层特征，以提高检测性能。标题中提到的“基于自适应特征卷积网络的行人检测方法”是针对Faster R-CNN这一经典的检测框架进行改进的。Faster R-CNN是一种两阶段的目标检测算法，它首先生成候选区域（Region Proposal Network，RPN），然后对这些区域进行分类和回归。然而，Faster R-CNN主要依赖深层特征来获取高级语义信息，而忽略了浅层特征可能包含的丰富细节。为了改善这一情况，作者提出了两种创新模块：SFCM（Self-adaptive Feature Convolution Module）和AFCM（Adaptive Feature Selection and Compression Module）。SFCM模块的设计目的是从CNN的浅层提取细节特征，这些特征对于识别行人的局部细节，如衣物纹理、姿态变化等至关重要。通过这种自适应的方式，SFCM可以增强模型对微小差异的敏感性。另一方面，AFCM模块借鉴了挤压与激励（Squeeze-and-Excitation，SE）操作，这是一种用于特征重权重化的技术，可以自动筛选出对行人检测最有价值的特征。AFCM能够动态地调整特征通道的权重，使模型更加关注那些对行人识别至关重要的特征，同时抑制不相关的信息。在实验部分，作者使用了两个标准的行人检测数据集——Caltech和INRIA，这两个数据集包含各种复杂的环境和场景。通过在Faster R-CNN的基础上逐步添加SFCM和AFCM模块，作者训练和优化了行人检测器。实验结果表明，提出的模块显著降低了误检率，分别降至9.13%和9.46%，这表明新方法在保持检测精度的同时，提高了模型的鲁棒性和泛化能力。这项工作对行人检测领域的贡献在于，它提出了一种新的策略来融合和利用CNN的浅层和深层特征，从而提高了行人检测的准确性和效率。这种方法不仅有助于解决传统方法中的问题，还为未来深度学习在行人检测和其他目标检测任务上的应用提供了新的思路。通过深入研究和优化特征提取过程，我们可以期待在行人检测技术上有更大的突破，尤其是在实际应用中，如监控系统、自动驾驶汽车和智能安全等领域。

收稿日期：２０１９０２２１；修回日期：２０１９０３２８　　基金项目：国家自然科学基金资助项目（６１８０６０３３）；重庆市重点产业共性关键技术创新

专项（

ｃｓｔｃ２０１７ｚｄｃｙｚｄｙｆＸ００１２）；国家社会科学基金西部项目（１８ＸＧＬ０１３）

作者简介：陈乔松（１９７８），男，重庆人，副教授，博士，主要研究方向为图像处理、模式识别、机器视觉（ｃｈｅｎｑｓ＠ｃｑｕｐｔ．ｅｄｕ．ｃｎ）；弓攀豪（１９９４），

男，陕西人，硕士，主要研究方向为模式识别与人工智能；申发海（１９９３），男，四川人，硕士，主要研究方向为模式识别与人工智能；陶亚（１９９４），女，山

西人，硕士，主要研究方向为模式识别与人工智能；董广县（１９９７），男，山东人，工学学士；王进（１９７９），男，重庆人，教授，博士，主要研究方向为大规模

数据挖掘与机器学习、大数据并行处理；邓欣（１９７９），男，重庆人，副教授，博士，主要研究方向为计算智能、脑机接口、认知机器人．

基于自适应特征卷积网络的行人检测方法



陈乔松，弓攀豪，申发海，陶　亚，董广县，王　进，邓　欣

（重庆邮电大学数据工程与可视计算重点实验室，重庆４０００６５）

摘　要：针对行人检测方法未能充分利用卷积网络浅层特征的问题，改进ＦａｓｔｅｒＲＣＮＮ框架，提出了一种基于

自适应特征卷积网络的行人检测方法。该方法有两处改进：ａ）设计了ＳＦＣＭ模块，用于提取卷积神经网络浅层

细节特征；ｂ）引用挤压与激励操作设计了ＡＦＣＭ模块，用于筛选检测所需的强辨识力行人特征。此外，利用公开

的Ｃａｌｔｅｃｈ和ＩＮＲＩＡ行人数据集，通过在基准框架中逐一添加ＳＦＣＭ和ＡＦＣＭ模块训练行人检测器，验证了所提

模块的有效性，并对比了主流行人检测算法。实验结果显示，所提方法的误检率分别降到了９．１３％和９．４６％，

具有更优的检测性能。

关键词：行人检测；卷积神经网络；浅层细节特征；自适应特征

中图分类号：ＴＰ３９１．４１　　　文献标志码：Ａ　　　文章编号：１００１３６９５（２０２０）０７０５９２２０２０４

ｄｏｉ

：１０．１９７３４／ｊ．ｉｓｓｎ．１００１３６９５．２０１９．０２．００３２

Ｐｅｄｅｓｔｒｉａｎｄｅｔｅｃｔｉｏｎｍｅｔｈｏｄｂａｓｅｄｏｎａｄａｐｔｉｖｅｆｅａｔｕｒｅｃｏｎｖｏｌｕｔｉｏｎｎｅｔｗｏｒｋ

ＣｈｅｎＱｉａｏｓｏｎｇ，ＧｏｎｇＰａｎｈａｏ，ＳｈｅｎＦａｈａｉ，ＴａｏＹａ，ＤｏｎｇＧｕａｎｇｘｉａｎ，ＷａｎｇＪｉｎ，ＤｅｎｇＸｉｎ

（ＫｅｙＬａｂｏｒａｔｏｒｙｏｆＤａｔａＥｎｇｉｎｅｅｒｉｎｇ＆ＶｉｓｕａｌＣｏｍｐｕｔｉｎｇ，ＣｈｏｎｇｑｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓ＆Ｔｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｃｈｏｎｇｑｉｎｇ４０００６５，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｔｏｃｉｒｃｕｍｖｅｎｔｔｈｅｐｒｏｂｌｅｍｏｆｆａｉｌｉｎｇｔｏｍａｋｅｆｕｌｌｕｓｅｏｆｔｈｅｓｈａｌｌｏｗｆｅａｔｕｒｅｓｏｆｔｈｅｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｔｗｏｒｋ，ｔｈｉｓｐａｐｅｒ

ｉｍｐｒｏｖｅｄｔｈｅｅｘｉｓｔｉｎｇＦａｓｔｅｒＲＣＮＮｆｒａｍｅｗｏｒｋａｎｄｐｒｏｐｏｓｅｄｐｅｄｅｓｔｒｉａｎｄｅｔｅｃｔｉｏｎｍｅｔｈｏｄｂａｓｅｄｏｎａｄａｐｔｉｖｅｆｅａｔｕｒｅｃｏｎｖｏｌｕｔｉｏｎ

ｎｅｔｗｏｒｋ

，ｆｏｒａｃｈｉｅｖｉｎｇｈｉｇｈｅｒｔｈｅｄｅｔｅｃｔｉｏｎａｃｃｕｒａｃｙ．Ｔｈｉｓｐａｐｅｒｈａｓｔｗｏｉｍｐｒｏｖｅｍｅｎｔｓ．Ｆｉｒｓｔｌｙ，ｉｔｄｅｓｉｇｎｅｄＳＦＣＭｍｏｄｕｌｅｔｏｅｘ

ｔｒａｃｔｔｈｅｓｈａｌｌｏｗｄｅｔａｉｌｆｅａｔｕｒｅｓｏｆｔｈｅｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ．Ｓｅｃｏｎｄｌｙ，ｉｔｐｒｏｐｏｓｅｄＡＦＣＭｍｏｄｕｌｅｂｙｕｔｉｌｉｚｉｎｇｔｈｅｓｑｕｅｅｚｅ

ａｎｄｅｘｃｉｔａｔｉｏｎｍｅｃｈａｎｉｓｍ，ｗｈｉｃｈｗａｓｕｓｅｄｔｏｓｃｒｅｅｎｔｈｅｓｔｒｏｎｇｄｉｓｃｒｉｍｉｎａｔｉｏｎｆｅａｔｕｒｅｓｏｆｐｅｄｅｓｔｒｉａｎ．Ｍｏｒｅｏｖｅｒ，ｉｔｕｓｅｄｔｗｏｐｕｂｌｉｃ

ｐｅｄｅｓｔｒｉａｎｄａｔａｓｅｔｓ，ＣａｌｔｅｃｈａｎｄＩＮＲＩＡ．ＩｔａｄｄｅｄＳＦＣＭｍｏｄｕｌｅａｎｄＡＦＣＭｍｏｄｕｌｅｏｎｅｂｙｏｎｅｉｎｔｈｅｂｅｎｃｈｍａｒｋｆｒａｍｅｗｏｒｋ，

ｗｈｉｃｈｖｅｒｉｆｉｅｄｔｈｅｖａｌｉｄｉｔｙｏｆｔｈｅｄｅｓｉｇｎｅｄｍｏｄｕｌｅｓ．Ｃｏｍｐａｒｅｄｗｉｔｈｓｏｍｅｅｘｉｓｔｉｎｇｐｅｒｓｏｎｄｅｔｅｃｔｉｏｎａｌｇｏｒｉｔｈｍｓ，ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅ

ｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄｈａｓｂｅｔｔｅｒｄｅｔｅｃｔｉｏｎｐｅｒｆｏｒｍａｎｃｅａｎｄｍｉｓｓｒａｔｅｄｒｏｐｐｅｄｔｏ９．１３％ａｎｄ９．４６％ｒｅｓｐｅｃｔｉｖｅｌｙ．

Ｋｅｙｗｏｒｄｓ：ｐｅｄｅｓｔｒｉａｎｄｅｔｅｃｔｉｏｎ；ｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ；ｓｈａｌｌｏｗｄｅｔａｉｌｆｅａｔｕｒｅｓ；ａｄａｐｔｉｖｅｆｅａｔｕｒｅ

０　引言

行人检测是计算机领域的热门研究课题之一。近年来已

广泛应用于智能视频监控、机动车辅助驾驶

［１］

以及行人图像

检索等多个领域，并在多个其他视觉任务中起着重要的支撑作

用。行人不同于自然场景中的其他物体，其躯体具有多变性，

不同的姿势和衣服颜色都会增加行人之间的差异性，使得行人

检测器难以训练。

目前行人检测方法可分为传统检测方法和基于深度学习

的检测方法两类。传统的检测方法由特征提取、分类和回归步

骤组成，代表性检测框架主要有

ＶＪ

［２］

检测器和ＨＯＧ

［３］

检测

器。其中

ＶＪ检测器是采用Ｈａａｒｌｉｋｅ特征和级联分类器实现

了快速的行人检测。随后

Ｄｏｌｌáｒ等人改进ＶＪ检测器，进一步

提出了简单有效的ＩＣＦ（ｉｎｔｅｇｒａｌｃｈａｎｎｅｌｆｅａｔｕｒｅｓ，积分通道特

征）和

ＡＣＦ

［４］

（ａｇｇｒｅｇａｔｅｄｃｈａｎｎｅｌｆｅａｔｕｒｅｓ，聚合通道特征），在

行人类上实现了更好的特征表达以及检测器分类性能。ＨＯＧ

检测器由ＨＯＧ特征和ＳＶＭ分类器组成，主要的工作是通过统

计图像局部区域的梯度方向直方图，构建ＨＯＧ特征描述子，并

通过ＳＶＭ算法完成行人分类器的训练。相继出现的传统行人

检测算法大多是以扩展ＨＯＧ算法为主，例如Ｆｅｌｚｅｎｓｚｗａｌｂ提出

的基于

ＤＰＭ

［５］

（ｄｅｆｏｒｍａｂｌｅｐａｒｔｂａｓｅｄｍｏｄｅｌ，可变形部件的模

型），其检测器具有更好的检测效果。

尽管上述方法中基于传统方法的行人检测器取得了可观

的分类效果，但是，随着近年来深度学习和机器学习的稳步发

展，利用卷积神经网络学习目标特征受到了人们的广泛关注与

研究，其中最具代表性的是单阶段网络

ＹＯＬＯ

［６］

系列算法和两

阶段网络ＲＣＮＮ

［７］

系列算法。ＹＯＬＯ系列算法的第一个版本

ＹＯＬＯｖ１是Ｒｅｄｍｏｎ等人

［６］

２０１６年提出的，它是在保证检测准

确率可观的基础上大幅度增加了检测网络的速度，并在当时引

发了研究者们的热议。而后相继提出的

ＹＯＬＯ９０００

［８］

和

ＹＯＬＯｖ３

［９］

更加有效地解决了ＹＯＬＯｖ１网络的局限性，提高了

网络检测对成群小目标检测的准确率，并优化了目标难以精确

定位的问题，以此实现了更好、更快、更强的目标检测器。两阶

段网络ＲＣＮＮ系列算法被广泛应用在大多数行人检测器

中

［１０～１４］

。例如文献［１０］，以ＦａｓｔｅｒＲＣＮＮ

［１５］

为主体框架，通

过大量实验评估不同类型的通道特征对ＦａｓｔｅｒＲＣＮＮ检测性

能的影响，并提出改进的框架

ＨｙｐｅｒＬｅａｒｎｅｒ联合学习行人特征

与额外的通道特征；文献［１１］以检测宽范围尺度的行人为出

发点，利用上采样操作使多个尺度的通道具有与输出特征类似

的高级语义功能，同时增加不同分支的跳层连接，以此提高网

第３７卷第７期

２０２０年７月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ３７Ｎｏ７

Ｊｕｌ．２０２０

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38577648

粉丝: 3
资源: 943

自适应特征卷积网络在行人检测中的应用

基于自适应多尺度图卷积网络的多标签图像识别.pdf

基于多尺度卷积神经网络的自适应熵加权决策融合船舶图像分类方法.docx

基于属性敏感卷积神经网络的行人属性分类.pdf

指数弹性动量卷积神经网络及其在行人检测中的应用.pdf

基于深度学习的行人检测.docx

基于深度学习的行人检测技术研究.pdf

基于ResNet34_D改进YOLOv3模型的行人检测算法.pdf

计算机视觉作业：基于直方图的自适应阈值分割、利用聚类技术实现纹理图像分割、模板匹配技术、目标跟踪、背景建模、目标检测.zip

基于PyQt和OpenCV的行人检测系统设计

基于Faster-RCNN的KITTI数据集车辆行人检测分析

最新资源