门控注意力机制：提升细粒度恢复性能

152 浏览量更新于2024-06-20 收藏 1.53MB PDF 举报

"细粒度恢复的门控注意力机制" 本文提出了一种名为“门控注意力机制”的新方法，旨在提升卷积神经网络（CNN）在细粒度识别任务中的性能。这种机制学习关注较低层次的功能激活，无需部分注释，利用这些激活来更新和校正输出的概率分布。与现有方法相比，该机制具有模块化、架构无关的特性，同时在参数和计算效率上表现出优势。在细粒度识别中，如CIFAR-10、Adience性别识别、斯坦福狗和UECFood-100等任务，网络系统通过应用该门控注意力机制，系统性地提高了分类精度，并增强了对噪声和干扰的鲁棒性。具体来说，该机制包括多个注意力模块，每个模块在不同深度上增强原始CNN，应用多个注意力头来处理网络特征图，基于局部信息进行类别预测。这一过程可以通过一个全局注意力门控来控制，允许网络动态地聚焦于图像的最关键区域。传统的注意力机制，如递归神经网络（RNN）或长短期记忆（LSTM）的迭代处理，以及空间Transformer网络（STN）和自上而下的前馈注意力机制（FAM），虽然各有其优点，但在处理细粒度识别时可能面临挑战。相比之下，门控注意力机制更侧重于利用局部信息，从而更好地适应细粒度分类的需求。论文指出，人类和动物的注意力机制使他们能在海量信息中高效处理关键信息，这一生物启发的概念被应用于深度学习模型中。通过模拟生物视觉系统的行为，该门控注意力机制能够帮助CNN在大量数据中定位和识别微小的差异，这对于区分相似类别的细粒度识别任务至关重要。实验结果显示，利用门控注意力机制增强的宽残差网络在各种基准测试中超越了最先进的分类准确性。这表明，该方法不仅提升了模型的泛化能力，还优化了模型的计算效率，使其在资源受限的情况下也能有效地执行任务。 "细粒度恢复的门控注意力机制"是一种创新的深度学习技术，它改进了CNN在处理复杂、细节丰富的视觉识别任务的能力。通过结合局部信息和全局注意力，该机制在提高分类精度的同时，增强了模型的鲁棒性和适应性，为未来在图像识别领域的研究提供了新的思路和工具。

r'ı

这两个网络是一个循环注意力建议网络（RA-CNN）和一个循环注意力建议网

络（

RA-CNN

），它迭代地细化输入的中心和规模。排序损失用于在每次迭代

时强制执行增量性能。

Zhao

等人

提出强制执行多个非重叠的注意区域[38]。整体架构包括一个注

意画布生成器，它从原始图像中提取不同区域和尺度的补丁;一个VGG-16

[27]然后使用CNN从补丁中提取特征，这些特征与长短期记忆[9]聚合，该记忆

关注补丁的非重叠区域利用每个区域中的平均预测来执行分类。类似地，在

[39]

中，他们提出了多注意力CNN（MA-CNN）来学习从VGG-19的输出中定位信

息块，并使用它们来训练部分分类器的集合。

在[12]中，他们提出从CNN的最后一层提取全局特征，就在分类器之前，并

使用它们来参与较低级别特征激活中的然后，对来自每个级别的参与激活进行

空间平均、逐通道级联，并馈送到最终分类器。与[12]的主要区别是：（i）注

意力图与基本模型并行计算，而[12]中的模型需要输出特征来计算注意力图;

（ii）WARN使用更少的参数，因此不需要放弃以获得竞争性能（这两个因素

清楚地反映在速度的增益中）

;

以及

(iii)门允许我们的模型忽略/参加不同的信息，以提高原始模型的性能，而在[12]

中，完整的输出函数被替换。结果，WARN在CIFAR10上获得了3.44%的误

差，优于

[12]同时是W/O并行化的7倍

所有先前描述的方法都涉及多级管道，并且其中大多数都使用强化学习进行

训练（这需要采样并且使它们训练起来很慢）。相比之下，STNs、FAM、[12]

中的模型和我们的方法联合提出的关注区域，并在一个单一的通道将它们此

外，与STNs和FAM不同，我们的方法只使用一个CNN流，它可以用于预先训

练的模型，并且它比

STNs

，

FAM

和

[12]

的计算效率高得多，如下所述

我们的方法

我们的方法包括一个通用注意力模块，可以在每个卷积层之后添加，而不会改

变任何架构的预定义信息路径（见图

）。这很有帮助，因为它无缝地增强了任

何架构，如VGG和ResNet，而无需额外的监督，

即

不需要部件标签。此外，它

还允许插入任何现有的训练网络，以快速执行迁移学习方法。

注意力模块由图

（

）中描绘的三个主要子模块组成：（

）注意力头部

，

其定义特征图的最相关区域，（ii）输出头部0，其在给定被关注信息的情况下

生成假设，以及（

iii

）置信度门

，其输出针对被关注信息的置信度得分。

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

门控注意力机制：提升细粒度恢复性能

注意力机制

社交物联网的细粒度跨域访问控制机制

CAP：细粒度分类的多重注意力机制解析

物联网感知层细粒度匿名访问控制机制

物流大数据的细粒度访问控制与属性撤销机制

云存储隐私保护：细粒度访问控制与属性撤销机制

注意力机制细粒度情感分析项目代码发布

AttnGAN:细粒度文本到图像生成与注意力机制

细粒度注意力机制的设计与实现

基于注意力机制的细粒度视觉分类

最新资源