精确紧凑的深度网络提升显著目标检测性能

100 浏览量更新于2024-06-19 收藏 2.02MB PDF 举报

"精确紧凑的深度网络用于显著目标检测"这篇论文探讨了在现代嵌入式设备中应用显著目标检测技术所面临的挑战，尤其是在输出分辨率和模型体积方面的限制。显著目标检测是一种关键的计算机视觉任务，旨在识别图像中最具吸引力的物体或区域，常用于诸如图像分割和图像字幕生成等高级视觉任务。作者陈舒涵、谭秀丽、王本和胡雪龙来自扬州大学信息工程学院，他们提出了一种创新的方法来解决这些问题。他们的核心贡献是设计了一种精确且轻量级的深度网络结构，该网络结合了残差学习和反向注意力机制。首先，网络通过残差学习对深层的粗略显著性预测进行细化，这种方法允许在网络保持高精度的同时显著减少卷积参数的数量，提高了效率。反向注意力机制是一个关键组件，它通过自上而下的指导，帮助网络在侧输出特征中排除已知的显著区域，从而使网络能够探索并恢复可能被忽略的物体部分和细节，从而提升高分辨率的显著性检测。这种方法在保持准确性的同时，显著提高了模型的速度（45 FPS），降低了模型大小，仅为81 MB，相较于现有的深度学习显著目标检测模型，如DS、ELD、DCL+、DHS、RFCN、NLDF和DSS+，在简单性、效率和模型轻量化方面表现出优越性。该研究的结果通过在六个基准数据集上的实验得到了验证，展示了新方法在实际应用中的潜力，特别是在资源受限的嵌入式设备上。这篇论文不仅提升了显著目标检测的技术水平，还为如何在小型设备上实现高效和精确的视觉分析提供了一个新的解决方案。"

Shuhan Chen et al.

快速有效地跟踪，从而显著提高性能

(3)得益于上述两个组成部分，我们的方法始终实现了与最先进方法相

当的性能，并在简单性，效率（45 FPS）和模型大小（81 MB）方面

具有优势。

相关工作

在过去的两篇论文中，提出了大量的显著性检测方法。在这里，我们

只关注最近的最先进的方法。这些方法都Kuen

等人。

[28]将回流单元

应用于FCNs中，以迭代地细化每个显著区域。Hu

等人。

[23]将基于

超像素的引导滤波器扩展为网络中用于边界细化的层 Hou

等人

[11]为

多尺度特征融合设计了短连接，而在Amulet [13]中，自适应地聚合了

多级卷积特征。Luo

等人

[10]提出了一种多分辨率网格结构来捕获局

部和全局线索。此外，引入了一个新的损失函数来惩罚边界上的错

误。Zhang

等人

[14]进一步提出了一种新的上采样方法，以减少反卷

积中产生的伪影最近，扩张卷积[23]和密集连接[17]被进一步合并以

获得高分辨率显着图。也有一些渐进的工作，以解决上述问题的语义

分割。在[19]中，提出了跳过连接来细化对象实例，而在[29]中，它

被用于构建拉普拉斯金字塔重建网络以进行对象边界细化。

我们尝试学习残差特征以进行低分辨率细化，而不是像上面那样

融合多级卷积特征。残差学习的思想首先由He

等人提出。

[25]用于图

像分类。之后，它被广泛应用于各种应用中。Ke

等人。

[21]将侧输出

残差特征用于精确的对象对称检测。Kim

等人。

[27]基于残差学习构

建了一个非常深的卷积网络，用于精确的图像超分辨率。

虽然将其应用于显著目标检测是很自然的，但性能并不令人满

意。为了解决这个问题，我们引入了注意机制，这是从人类的感知过

程的启发。它利用顶层信息有效地在[12，30]中，注意力模型被设计

用于对多尺度特征进行加权。在[31]中，剩余注意力模块被用来生成

用于图像分类的深度注意力感知在ILSVRC 2017图像分类挑战赛中，

等人。

[32]通过构建用于通道注意力的挤压和激励块获得第一名。

Huang

等人。

[33]设计了一个注意力掩码来突出反向对象类的预测，

然后从原始预测中减去，以纠正语义分割混淆区域中的错误。受其启

发，但不同的是，我们采用反向注意自上而下的方式来指导侧输出剩

余学习。从中受益，我们可以了解更准确的剩余细节，从而导致显着

的改善。

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

精确紧凑的深度网络提升显著目标检测性能

基于结构感知深度神经网络的显著性对象检测算法.pdf

显著性检测数据集 ECSSD

基于全卷积神经网络的多目标显著性检测.pdf

c++ yolov5 多目标识别

python车辆检测

localization distillation for dense object detection

yolo v5与k210

那么Mask R-CNN是什么

yolov8网络应用

周宏仁机动目标跟踪[m]

最新资源