criss-cross attention的计算公式
时间: 2024-05-14 10:09:52 浏览: 159
线性规划的无比值检验criss-cross算法 (2009年)
criss-cross attention是一种用于计算机视觉任务中的注意力机制,它可以帮助模型在处理图像时更好地捕捉全局和局部之间的关系。下面是criss-cross attention的计算公式:
给定输入特征图Q(query)、K(key)和V(value),首先计算它们之间的相似度矩阵S:
S = Q * K^T
其中,^T表示矩阵的转置操作。
然后,对于每个位置i,计算其在行方向和列方向上的最大值:
r_i = max(S_i, row)
c_i = max(S_i, column)
其中,S_i, row表示矩阵S第i行的最大值,S_i, column表示矩阵S第i列的最大值。
接下来,使用这些最大值来计算行方向和列方向上的注意力权重分布:
a_i, row = exp(r_i) / sum(exp(r))
a_i, column = exp(c_i) / sum(exp(c))
其中,exp表示指数函数,sum表示求和操作。
最后,使用这些注意力权重分布来加权求和得到最终的输出特征图:
O = a_row * V * a_column^T
其中,*表示矩阵乘法操作,^T表示矩阵的转置操作。
阅读全文