cbam注意力机制公式
时间: 2023-10-04 22:07:57 浏览: 72
计算机视觉中的注意力机制
CBAM(Convolutional Block Attention Module)是一种用于图像分类任务的注意力机制模型,它结合了通道注意力机制和空间注意力机制。其公式如下:
通道注意力机制:
$$
\boldsymbol{M}_{c}=\operatorname{sigmoid}\left(\frac{1}{H W} \sum_{i=1}^{H} \sum_{j=1}^{W} \boldsymbol{F}_{i, j, c}\right)
$$
$$
\boldsymbol{F}_{c}=\boldsymbol{M}_{c} * \boldsymbol{F}
$$
其中,$\boldsymbol{F}$ 表示输入特征图,$H$ 和 $W$ 分别表示特征图的高度和宽度,$\boldsymbol{F}_{i,j,c}$ 表示特征图在位置 $(i,j)$ 上通道 $c$ 的值,$\boldsymbol{M}_{c}$ 是通道注意力系数,$\boldsymbol{F}_{c}$ 是经过通道注意力调节后的特征图。
空间注意力机制:
$$
\boldsymbol{M}_{s}=\operatorname{sigmoid}\left(\boldsymbol{W}_{s} * \operatorname{AvgPool}\left(\boldsymbol{F}\right)\right)
$$
$$
\boldsymbol{F}_{s}=\boldsymbol{M}_{s} \odot \boldsymbol{F}
$$
其中,$\operatorname{AvgPool}(\cdot)$ 表示对输入特征图进行全局平均池化操作,$\boldsymbol{W}_{s}$ 是一个卷积核,用于提取空间注意力系数 $\boldsymbol{M}_{s}$,$\odot$ 表示逐元素乘积,$\boldsymbol{F}_{s}$ 是经过空间注意力调节后的特征图。
最终的输出特征图为 $\boldsymbol{F}_{cs}=\boldsymbol{F}_{s}+\boldsymbol{F}_{c}$,它是经过通道注意力和空间注意力调节后的特征图。
阅读全文