transformer的变种
时间: 2023-08-31 18:05:29 浏览: 175
transformer论文笔记及思维导图
Transformer的变种包括Axial Transformer、Sparse Transformer和Reformer。Axial Transformer是一种多维Transformer,其注意力机制是轴向的,可以处理多维输入数据。 Sparse Transformer是一种用于生成长序列的Transformer模型,它通过稀疏注意力机制实现了高效的计算和存储。 Reformer是一种高效的Transformer变种,通过使用局部和全局注意力机制以及哈希技术来减少计算量和存储需求。 这些变种都是基于Transformer模型的改进和扩展,旨在提高其性能和效率。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [Google综述:细数Transformer模型的17大高效变种](https://blog.csdn.net/algorithmPro/article/details/115258105)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文