swin transformer概述
时间: 2023-08-25 08:15:53 浏览: 112
Swin Transformer 是一种基于Transformer的深度学习模型,用于视觉任务。它解决了原始 Vision Transformer 的一些问题,并成为当前广泛应用于图像分类和对象检测等视觉任务的主干架构。与 Vision Transformer (ViT) 不同,Swin Transformer 在效率和准确性方面表现出色。它引入了两个关键概念,即分层特征图和移动窗口注意力,来解决原始 ViT 面临的问题。Swin Transformer的整体架构如图示所示,其中使用了“patch merging”作为第一个块的名称。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [Swin-Transformer 详解](https://blog.csdn.net/wangbingqian_110/article/details/124953433)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文