"双线性聚合残差注意力的细粒度图像分类模型研究综述"

版权申诉

48 浏览量更新于2024-02-25 收藏 1.28MB DOCX 举报

细粒度图像分类已成为计算机视觉与图像处理领域的研究热点之一。与传统的粗粒度图像分类不同，细粒度图像分类着重于区分常见目标类别中的子类别，如鸟的种类、飞机型号等。由于不同类别之间的子类别十分相似，大部分类别仅能通过局部区域中的差别部件来进行识别，这使得细粒度图像分类成为一个更具挑战性的研究任务。在早期的研究中，一些学者提出了利用人工部件标注信息来协助强化模型定位的方法，以实现强监督的训练方式来提高分类精度。例如，Zhang等人利用区域选择性算法生成区域，并结合边框与几何约束条件，完成对象与部件级别的目标位置检测与定位。另外，Lin等人则通过实现网络模型局部部件定位、对齐和网络分类三个模块的融合，通过部件定位模块递归完成对标注框的识别，然后使用对齐模块进行姿态和模板的协调对准，最终通过阀连接函数（valve linkage function,VLF）连接三个模块，优化分类精度。尽管利用丰富的部件标注信息和精准的检测定位技术可以实现更高的识别分类精度，但人工标注费用昂贵且容易出现局部语义信息的错误注解，不符合现实研究与应用的需求。因此，针对细粒度图像分类任务的特性，本文提出了一种新的方法——双线性聚合残差注意力模型。该模型不仅可以避免人工标注信息的不足之处，还能有效提高细粒度图像分类的准确性和鲁棒性。具体而言，我们主要针对细粒度图像分类任务设计了一个双线性聚合残差注意力模型。该模型具有以下几个特点：首先，我们利用残差结构来构建模型，通过残差连接和注意力机制的引入，增强了模型对细粒度图像特征的学习能力。其次，我们采用双线性聚合的方法，有效地捕获了图像中不同部件之间的交互关系，从而更好地区分不同类别之间的子类别。另外，我们还引入了注意力机制，使模型能够自动学习并关注区分不同类别所需的关键部件或特征，从而提升了分类的准确性。最后，我们在实验中充分验证了我们提出的双线性聚合残差注意力模型在细粒度图像分类任务上的有效性和优越性。通过在大规模细粒度图像数据集上进行实验，我们发现我们的模型相较于传统方法在分类准确性和鲁棒性方面均取得了显著的提升。特别是，在处理鸟类和飞机等细粒度图像分类任务时，我们的模型表现出了更好的性能，验证了其在实际应用中的可行性和有效性。总之，本文提出的双线性聚合残差注意力模型为解决细粒度图像分类问题提供了一种新的思路和方法。该模型在实验中取得了显著的表现，展现出了巨大的应用潜力。我们相信，随着深度学习和计算机视觉技术的不断发展，我们的模型将会在细粒度图像分类领域发挥重要作用，并为相关研究和应用提供有力的支持。

一是结合分散注意力的双线性聚合残差网络（ bilinear aggregate residual

network,BARN）;二是互通道注意力模块（MCA）。如图 2 所示。

图 2

图 2 双线性聚合残差注意力网络架构

Fig.2 Bilinear aggregate residual attention network

具体而言 ,首先采用两个 ResneXt29 网络分别替换原 B-CNN 模型中的

VGG16-D 与 VGG16-M,作为图像的特征提取器,使其设计成一种新颖的双线性

聚合残差网络（BARN）,来完成卷积特征的深度提取;然后为双线性聚合残差

网络（ResneXt29×2）中的每一个聚合转换残差子模块嵌入分散注意力模块

（SA）,整合跨维度的特征通道之间的权重信息,进一步强化整个网络的表征依

赖性;最后对两个聚合残差网络分支提取的特征进行多维度的融合操作,得到加

权融合后的特征通道图（feature channels map,FCM）,使其更加完整性地传递

给互通道注意力模块（MCA）,来强制每一维度的特征通道按照类别进行划分,

使得属于同一类别下的特征更具有判别力,并约束同一类别的特征在空间维度

上更加互斥,即关注多样化且具有差异性的细节。通过以上双重注意力过滤捕

获策略,能够促使模型学习到更加全面的图像表征知识。

2.2 嵌入分散注意力模块

剩余22页未读，继续阅读

罗伯特之技术屋

粉丝: 4452
资源: 1万+

"双线性聚合残差注意力的细粒度图像分类模型研究综述"

基于注意力数据增广的细粒度图像分类方法.docx

残差注意力 图像融合.zip

面向细粒度图像分类的双线性残差注意力网络

基于改进深度残差网络的图像分类算法.docx

基于多分支神经网络模型的弱监督细粒度图像分类方法.pdf

多维注意力特征聚合立体匹配算法.docx

基于残差密集连接与注意力融合的人群计数算法.docx

一种顾及细粒度信息与残差网络的高分辨率遥感影像场景分类法.docx

双线性残差注意力网络提升细粒度图像分类性能

基于深度残差网络的机载LiDAR点云分类.docx

最新资源

残差注意力图像融合.zip