C3TR中的transformer模块
时间: 2023-11-02 19:03:17 浏览: 272
transformer
C3TR中的transformer模块是由多个Block组成的。每个Block包含了自注意力机制、残差链接、LayerNorm、全连接层(FC)和再次的残差链接和LayerNorm。在每个Block中,输出向量被传递给下一个Block,直到所有的Block都被处理完毕。在多头注意力中,增加了q、k、v的数量,因此称之为多头。网络的优化可以通过更改LayerNorm的位置顺序或更换层(layerNorm --> PowerNorm)来实现。
阅读全文