视觉注意力机制详解：应用与进展

需积分: 0 185 浏览量更新于2024-08-05 收藏 2.18MB PDF 举报

Attention机制在计算机视觉领域扮演着关键角色，它是一种强大的注意力模型，用于提升模型对输入数据的局部或全局特征的关注程度。该机制可以分为两个主要应用场景： 1. 学习权重分布： Attention的核心在于赋予输入数据的不同部分不同程度的权重，这可以根据不同的策略进行实现。软注意力(soft attention)允许模型对所有输入部分进行加权平均，确保所有信息都被考虑；而硬注意力(hard attention)则可能通过强化学习(Reinforcement Learning, RL)来选择性地聚焦于部分区域。这种加权可以发生在原始图像空间、特征图上，比如在图像描述生成任务中，如《Show, Attend, and Tell: Neural Image Caption Generation with Visual Attention》中，通过调整每个像素或通道的重要性。此外，Attention还能应用于不同空间尺度和时间维度，如在机器翻译(Machine Translation)中处理上下文关系。 2. 任务聚焦： Attention机制也被用来分解任务，构建专门的网络分支来专注于子任务，这样可以优化网络资源分配，降低原始任务的复杂性，使得模型训练更为高效。例如，在细粒度图像识别领域，如Jianlong Fu、Heliang Zheng和Tao Mei在《Look Closer to See Better: Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition》(CVPR 2017)中，他们设计了一种递归注意力卷积神经网络，其中包含一个分类网络和一个产生注意力提议网络(APN)，APN能生成针对目标对象的自适应区域，提高了识别精度。 Attention机制在计算机视觉中的应用广泛且深入，它不仅帮助模型聚焦于关键信息，还通过任务分解和资源分配优化了模型性能，成为了现代深度学习中不可或缺的一部分。理解并有效利用Attention机制，能够显著提升视觉任务的准确性和效率。

什么

是

Attention

机

制

？

其实我没有找到attention的具体定义，但在计算机视觉的相关应用中大概可以

分为两种：

1）

学

习

权

重

分

布

：

输

入

数

据

或

特

征

图

上

的

不

同

部

分

对

应

的

专

注

度

不

同

，对此

Jason Zhao在知乎回答中概括得很好，大体如下：

- 这个加权可以是保留所有分量均做加权（即soft attention）；也可以是在分

布中以某种采样策略选取部分分量（即hard attention），此时常用RL来做。

- 这个加权可以作用在原图上，也就是《Recurrent Model of Visual

Attention》（RAM）和《Multiple Object Recognition with Visual

Attention》（DRAM）；也可以作用在特征图上，如后续的好多文章（例如image

caption中的《 Show, Attend and Tell: Neural Image Caption Generation

with Visual Attention》)。

- 这个加权可以作用在空间尺度上，给不同空间区域加权；也可以作用在

channel尺度上，给不同通道特征加权；甚至特征图上每个元素加权。

- 这个加权还可以作用在不同时刻历史特征上，如Machine Translation。

）

任

务

聚

焦

：

通过

将

任

务分

解

，

设计

不

同

的

网络结

构

（

或

分

支

）

专

注

于不

同

的

子

任

务

，

重

新

分

配

网络

的

学

习

能

力

，

从

而

降

低

原

始

任

务

的

难

度

，

使

网络

更

加

容

易

训

练

。

2. Attention

机

制

应

用

在

了

哪

些

地

方

？

针对于1部分中的attention的两大方式，这里主要关注其在视觉的相关应用中。

2.1

方

式

一

：

学

习

权

重

分

布

下载后可阅读完整内容，剩余7页未读，立即下载

马李灵珊

粉丝: 41

视觉注意力机制详解：应用与进展

ECShop2.5.1 文件结构与功能解析

深度学习中Attention机制的实践与应用

Self-Attention技术研究进展深度解读

Matlab实现Attention-GRU多变量时间序列预测 1.Matlab实现Attention-GRU多变量时间序列预测(

Matlab实现Attention-GRU多变量时间序列预测 1.Matlab实现Attention-GRU多变量时间序列预测(注意力机制融合门控循环单元，也可称呼TPA-GRU，时间注意力机制结合门

fine_grained_classification-master.zip_Multi-Attention；_classifi

Python库 | pure_attention-0.0.26-py3-none-any.whl

基于MFO-TCN-BiGRU-Attention的Matlab多变量时间序列预测模型源码与数据集,Matlab完整源码和数据（ 1.基于MFO-TCN-BiGRU-Attention飞蛾扑火算法优化

Matlab源码实现：基于OOA-TCN-BiGRU-Attention混合模型的多变量时间序列预测系统完整解决方案,Matlab完整源码和数据 1.基于OOA-TCN-BiGRU-Attention

Matlab 2023版以上多变量时间序列预测模型：CPO-TCN-BiGRU-Attention算法优化与多指标评价完整源码集,Matlab完整源码和数据 1.基于CPO-TCN-BiGRU-Att

最新资源