深度感知CNN：提升RGB-D语义分割的新方法

135 浏览量更新于2024-06-20 收藏 1.64MB PDF 举报

"深度感知CNN用于RGB-D分割" 本文主要探讨了如何利用深度感知卷积神经网络（CNN）提升RGB-D语义分割的性能。RGB-D分割是计算机视觉领域的一个重要任务，它涉及到同时分析彩色图像（RGB）和深度图像（D），以理解和分割场景中的不同对象。传统的卷积神经网络在处理几何信息方面存在局限，因为其基于固定网格的结构无法有效地捕获和利用深度数据的几何特性。深度感知CNN提出了一种新的方法，通过引入深度感知卷积和深度感知平均池化两个操作，将几何信息无缝地整合到现有的CNN架构中。这两个操作在信息传播过程中利用像素间的深度相似性，无需增加额外的网络参数，就能增强网络对几何形状的理解。深度感知卷积允许网络根据像素的深度差异调整滤波器的响应，而深度感知平均池化则考虑了深度信息在池化过程中的作用，使得网络能够更好地识别和区分具有相似视觉特征但深度不同的物体。作者指出，过去的RGB-D语义分割方法要么通过将深度作为附加图像输入，要么通过处理3D体积或点云，但这两种方法都带来了计算和存储的高昂代价。相比之下，深度感知CNN提供了一种更灵活且高效的方式，能够在2D CNN中利用3D几何信息，降低了计算复杂度。文中还提到了一些现有的工作，如全卷积网络（FCN）和其他双流网络架构，这些方法虽然提高了场景理解的性能，但仍然受限于CNN的固定几何结构。3D网络如体积CNN和3D点云图网络虽然能处理几何形状，但计算成本较高。因此，深度感知CNN的提出旨在解决这些挑战，提供一个在保持效率的同时，能够充分利用深度信息的解决方案。实验和消融研究在具有挑战性的RGB-D语义分割基准上验证了深度感知CNN的有效性。通过这些实验，作者证明了他们的方法在提高分割精度和降低计算成本方面都有显著的优势。这表明深度感知CNN是RGB-D语义分割任务的一个强大工具，对于推动深度学习在3D场景理解领域的应用具有重要意义。

王与诺依曼

深度

深度相似

性

输入要素

Conv内核

深度

深度相似

性

输入要素

保持参数的相同复杂性。该算子在语义分割等视觉任务上实现了更好

的性能。空间变换网络[15]通过学习全局空间变换来扭曲特征图。可

变形CNN [7]学习内核偏移以增加空间采样位置。这些方法已经表

明，几何变换可以提高不同视觉任务的性能。

随着3D传感器的进步，深度可以以低成本应用。驻留在深度中的

几何信息与CNN中的空间变换高度相关。双边滤波器[3，2]广泛用于

计算机图形学中，用于保持边缘的图像平滑。它们使用高斯项来加权

相邻像素。与双边滤波器类似，我们的方法将像素的几何关系集成

到CNN的基本操作中，即。卷积和池化，我们使用加权内核并迫使每

个神经元对输出有不同的贡献。该加权核由深度定义，并且能够在不

引入任何参数的情况下并入几何关系。

深度感知CNN

在本节中，我们将介绍两个深度感知操作：深度感知卷积和深度感知

平均池化。它们既简单又直观。两个操作都需要两个输入：输入特征

图x

∈

和深度图像D

∈

，其中

是输入特征通道的数目，

是高度，

是宽度。输出特征图表示为y

∈

，其中

是输出特征

通道的数量。虽然x和y都是3D张量，但为了符号清晰，在2D空间域

中解释操作，并且它们在不同通道中保持相同。

(a)深度感知卷积 (b)深度感知平均池化

图二. 深度感知CNN中的信息传播的图示。在不失一般性的情况下，我们

仅示出了一个内核大小为3

3的滤波器窗口在图中所示的深度相似性中，

较深的颜色表示较高的相似性，而较浅的颜色表示两个像素在深度上较不

相似。在（a）中，深度感知卷积的输出激活是深度相似性窗口与输入特

征图上的卷积窗口的乘积类似地，在（b）中，深度感知平均池化的输出

是通过深度相似性加权的输入窗口的平均值。

3.1

深度感知卷积

标准2D卷积运算是局部网格的加权和。对于y上的每个像素位置p

，

标准2D卷积的输出为

剩余17页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度感知CNN：提升RGB-D语义分割的新方法

RGB-D实例分割：双金字塔特征融合网络方法

全景图像深度预测：失真感知卷积滤波器方法

多机器人感知系统：基于深度学习的视觉SLAM研究

深度感知CNN如何将RGB-D数据的几何信息高效整合到卷积神经网络中？

在深度感知CNN中，如何利用深度感知卷积和深度感知平均池化来整合RGB-D数据中的几何信息？

基于神经网络RGB-D图像分割

基于语义先验和深度约束的室内动态场景RGB-D SLAM算法.docx

深度感知卷积神经网络是如何实现RGB-D数据的几何信息高效整合的？

深度学习实例分割：3D-BoNet.zip

Python-自驾道路语义分割深度网络实现

最新资源