室内RGB-D图像语义分割:双流加权Gabor融合提升性能

3 下载量 170 浏览量 更新于2024-08-27 收藏 13.59MB PDF 举报
本文主要探讨了"基于双流加权Gabor卷积网络融合的室内RGB-D图像语义分割"这一主题。在现代室内环境感知和理解中,由于光照变化、物体遮挡以及类别多样性等复杂因素,传统的图像语义分割方法往往面临挑战。为此,研究者提出了一种创新的方法,该方法结合了彩色(RGB)和深度(Depth)信息,通过双流架构来提高分割性能。 首先,为了增强对方向和尺度不变性的特征提取,研究人员设计了一种加权Gabor方向滤波器。Gabor滤波器是一种经典的图像处理工具,它能够捕捉到局部特征的细节,通过权重调整,使网络能更好地适应不同方向和尺度的变化,从而提升深度卷积网络(DCN)的特征表示能力。 接着,为了构建一个轻量级的特征提取网络,采用了宽残差-加权Gabor卷积网络。这种网络结构结合了残差学习的思想,允许信息在网络的不同层之间直接传递,同时利用加权Gabor卷积单元提取彩色和深度图像的特征。这种方法能够更有效地处理高维数据,并保持模型的计算效率。 在特征融合阶段,文章提出了利用金字塔池化模块对深度特征进行多尺度融合。这种方法有助于整合不同尺度的信息,增强对图像上下文的理解,这对于解决室内场景中的复杂场景尤为重要,因为物体可能在不同的尺度下呈现不同的视觉特性。 实验部分,研究者选择NYUDv2数据集作为评估平台,对比了所提出的语义分割方法与其他常见的分割算法。实验结果表明,该方法在面对光照变化和遮挡问题时展现出良好的鲁棒性和有效性,分割效果具有竞争力,证明了其在实际应用中的潜力。 本文的贡献在于提出了一种有效的室内RGB-D图像语义分割策略,通过双流加权Gabor卷积网络融合彩色和深度信息,以及多尺度特征融合,提高了分割的准确性和鲁棒性。这对于提高室内环境的自动化理解和导航等领域具有重要意义。