多视图互相关注意力网络在SAR场景分类中的应用

需积分: 0 1 下载量 136 浏览量 更新于2024-08-12 收藏 907KB PDF 举报
"基于多视图互相关注意网络的合成孔径雷达场景分类技术,旨在解决传统二阶池方法在SAR图像分类中的不足。文章提出了一个名为MCAN的新型深度学习模型,通过空间和通道自关注模块捕获特征间的交互,并通过全局空间和通道的协方差池化层学习互相关性。此外,引入了迭代矩阵平方根归一化层以增强特征表示的区分性。实验结果表明,MCAN在TerraSAR-X SAR数据集上的表现超越了其他相关方法。" 本文主要探讨的是合成孔径雷达(Synthetic Aperture Radar, SAR)图像的场景分类问题,这是一个关键的遥感图像处理任务。传统的第一阶池化方法主要关注单个特征,而第二阶池化方法则探索更高级别的特征统计信息,这在某些场景分类中取得了显著效果。然而,SAR图像的特性使得目标既有相似性又有独特性,单一视角的二阶池化并不完全适用。 针对这一挑战,作者提出了一种名为多视图互相关注意力网络(Multi-view Cross-correlation Attention Network, MCAN)的新框架。这个框架采用端到端的训练方式,旨在更好地适应SAR图像的复杂性。首先,MCAN利用空间和通道自关注模块(self-attention modules),分析卷积特征在空间和通道维度上的相互依赖关系,这种机制有助于捕捉图像中的局部和全局模式。接着,全局空间和通道的协方差池化层被整合到网络中,这些层可以学习特征统计信息中的空间和通道交叉相关性,从而捕捉图像内部的多样性和奇异特性。 为了进一步提升特征表示的区分性,文章还介绍了一个迭代矩阵平方根归一化(Iterative Matrix Square Root Normalization, IMSRN)层。IMSRN能够高效地计算协方差矩阵的平方根,这在保持计算效率的同时增强了特征向量的辨别能力,有助于提高分类性能。 实验部分,MCAN在TerraSAR-X SAR数据集上的场景分类表现优于其他相关工作,验证了其在SAR图像处理领域的有效性和优越性。这一研究为SAR图像处理提供了新的视角和工具,对于提升遥感图像的自动识别和分析能力具有重要意义。