多尺度上下文交织的语义分割技术

110 浏览量更新于2024-06-20 收藏 1.68MB PDF 举报

"该文提出了一种名为多尺度上下文交织(MSCI)的语义分割方法，通过结合局部外观、语义信息和全局场景特征，提高分割精度。它利用LSTM单元在不同尺度间双向、循环地融合特征映射，同时通过超像素的空间关系进行自适应的上下文聚合。这种方法在多个公共基准上进行了广泛评估，证明了其增强信息传播效率和分割准确性的优势。关键词包括语义分割、深度学习、卷积神经网络和长短期记忆网络。" 在计算机视觉领域，语义分割是一项关键任务，旨在为图像的每个像素赋予语义类别，如自动驾驶、医学影像分析和计算摄影等应用都能从中受益。随着深度学习的发展，特别是全卷积网络(FCN)的出现，语义分割的性能得到了显著提升。FCN及其后续改进如空间金字塔池化(SPP)网络和编码器-解码器(ED)网络，通过层次化的特征提取和传播，能够在一定程度上融合不同尺度的信息。然而，现有的方法在信息融合策略上存在局限，通常采用单向的方式在尺度间传递信息。为了克服这一限制，本文提出了多尺度上下文交织(MSCI)网络。MSCI网络引入了双向LSTM链，允许特征映射在不同尺度间以循环方式进行交互，这样能够更有效地捕获和融合上下文信息。此外，通过对图像进行超像素划分，网络能够利用像素间的空间关系进行自适应的上下文聚合，进一步提升特征表示的质量。在训练过程中，LSTM单元的参数被优化以适应像素级别的语义分割任务，从而学习到如何提取强大的特征并进行层次化的组合。相比于固定的信息传播路径，这种动态的方法使网络能够根据图像内容灵活调整其信息处理策略。实验结果表明，MSCI网络的各个组件都有助于提高信息传播效率，显著提升了分割的精确度，验证了该方法的有效性。基于多尺度上下文交织的语义分割方法为解决语义分割问题提供了一个新的视角，通过增强信息融合和自适应上下文处理，它有望推动语义分割技术的进步，特别是在那些需要高精度和复杂场景理解的应用中。

D. Lin，Y.Ji，D.Lischinski、D.Cohen-Or和H.黄

为了提高性能，一些网络[35，17，19，21]利用编码器-解码器（ED）

网络沿着公共FCN架构的自上而下的层次结构逐渐组合相邻的特征

图，将语义信息从低分辨率特征图传播到高分辨率特征图，并使用高

分辨率特征图来恢复对象的细节（参见图1（b））。最新的工作[25]

进一步使用了ED网络以及一个atrous空间金字塔池（ASPP）[20]，并

结合了多分辨率特征图来丰富信息。在ED网络中，解码器部分的每

个特征图仅直接从编码器部分的相同级别的特征图接收信息。但是由

编码器部分的相邻较低分辨率特征图提供的强相关语义信息必须通过

附加的中间层以到达相同的解码器层，这可能导致信息衰减。

相比之下，我们的方法直接结合了深层网络层次结构中的相邻特

征图对。它创建新的特征图，这些特征图直接从较低分辨率的特征图

接收语义信息和上下文，并从较高分辨率的特征图接收改进的空间细

节。此外，在我们的架构中，特征图之间的信息交换是经常性的和双

向的，从而实现更好的特征学习。成对双向连接产生所得到的特征图

的第二

水平

层次结构，导致全分辨率上下文丰富的特征图（图1（c）

中最右边的特征图），其用于逐像素标签预测。

特征连接特征图之间的连接使具有不同感受野大小的神经元之间能够

通信，从而产生编码多尺度上下文信息的新特征图基本上，基于FCN

的模型

通常，它们使用具有预定义形状的卷积/池化内核来聚集相邻

神经元的信息，并将该信息传播到其他特征图的神经元但是传统的卷

积/池化内核仅在局部范围内捕获上下文信息。为了利用更丰富的上

下文信息，图形模型与FCN集成[12，13，16]。图形模型在特征图之

间建立了密集的连接，使神经元对全局图像内容更加敏感，这对于学

习良好的分割特征至关重要。注意，先前的工作使用从特征图单独提

取上下文信息的单向连接，其甚至被组合。因此，给定尺度下的学习

特征没有被给予最佳地考虑来自所有其他尺度的多尺度上下文信息的

机会。

与以前的方法相比，我们的双向连接交换多尺度上下文信息，以提高

所有功能的学习。我们使用基于图像结构计算的超像素，并使用它们之

间的关系来定义不同特征图中神经元之间的交换路径。这使得能够实现

更自适应的上下文信息传播。几个先前的作品[31-并且在[37，38]中研究

了用于对象检测的信息交换但

剩余18页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

多尺度上下文交织的语义分割技术

dilation-tensorflow:根据通过扩张卷积的多尺度上下文聚合（2016），语义分割的原生Tensorflow实现。 可以选择使用作者预先训练的权重

基于多层级上下文信息的图像语义分割

基于聚合特征和上下文信息的语义分割

Dilation-Pytorch-Semantic-Segmentation:由Yu和Koltun进行的基于卷积的多尺度上下文聚合的语义分割的PyTorch实现

基于多尺度上下文信息的图像目标分类算法

网络游戏-基于多尺度卷积神经网络的语义分割方法.zip

PyTorch实现的语义分割：基于Dilation的卷积多尺度上下文聚合

深度学习下基于多层级上下文的图像语义分割提升策略

多尺度语义分割和单尺度语义分割有什么区别

基于上下文注意力CNN的三维点云语义分割

最新资源

dilation-tensorflow:根据通过扩张卷积的多尺度上下文聚合（2016），语义分割的原生Tensorflow实现。可以选择使用作者预先训练的权重