精确紧凑的深度网络提升显著目标检测性能

0 下载量 100 浏览量 更新于2024-06-19 收藏 2.02MB PDF 举报
"精确紧凑的深度网络用于显著目标检测"这篇论文探讨了在现代嵌入式设备中应用显著目标检测技术所面临的挑战,尤其是在输出分辨率和模型体积方面的限制。显著目标检测是一种关键的计算机视觉任务,旨在识别图像中最具吸引力的物体或区域,常用于诸如图像分割和图像字幕生成等高级视觉任务。 作者陈舒涵、谭秀丽、王本和胡雪龙来自扬州大学信息工程学院,他们提出了一种创新的方法来解决这些问题。他们的核心贡献是设计了一种精确且轻量级的深度网络结构,该网络结合了残差学习和反向注意力机制。首先,网络通过残差学习对深层的粗略显著性预测进行细化,这种方法允许在网络保持高精度的同时显著减少卷积参数的数量,提高了效率。 反向注意力机制是一个关键组件,它通过自上而下的指导,帮助网络在侧输出特征中排除已知的显著区域,从而使网络能够探索并恢复可能被忽略的物体部分和细节,从而提升高分辨率的显著性检测。这种方法在保持准确性的同时,显著提高了模型的速度(45 FPS),降低了模型大小,仅为81 MB,相较于现有的深度学习显著目标检测模型,如DS、ELD、DCL+、DHS、RFCN、NLDF和DSS+,在简单性、效率和模型轻量化方面表现出优越性。 该研究的结果通过在六个基准数据集上的实验得到了验证,展示了新方法在实际应用中的潜力,特别是在资源受限的嵌入式设备上。这篇论文不仅提升了显著目标检测的技术水平,还为如何在小型设备上实现高效和精确的视觉分析提供了一个新的解决方案。"