线性 transformer
时间: 2023-09-07 21:12:04 浏览: 184
线性transformer是一种变形的transformer模型。它在传统的softmax注意力的基础上,使用了基于特征图的点积注意力。这种变化使得线性transformer在时间和空间复杂度上更优,并且能够在线性时间内执行序列生成的因果模型,类似于递归神经网络。具体而言,在第3.1节中,我们介绍了基于transformer架构的公式。随后,在第3.2节和第3.3节中,我们提出了线性transformer的概念。最后,在第3.4节中,我们将transformer重写为循环神经网络。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [【Transformer架构】Transformers are RNNs (linear transformer)](https://blog.csdn.net/hymn1993/article/details/125254897)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文