首页swin transformer概述

swin transformer概述

时间: 2023-08-25 13:15:53 浏览: 117

Swin Transformer 是一种基于Transformer的深度学习模型，用于视觉任务。它解决了原始 Vision Transformer 的一些问题，并成为当前广泛应用于图像分类和对象检测等视觉任务的主干架构。与 Vision Transformer (ViT) 不同，Swin Transformer 在效率和准确性方面表现出色。它引入了两个关键概念，即分层特征图和移动窗口注意力，来解决原始 ViT 面临的问题。Swin Transformer的整体架构如图示所示，其中使用了“patch merging”作为第一个块的名称。123 #### 引用[.reference_title] - *1* *2* *3* [Swin-Transformer 详解](https://blog.csdn.net/wangbingqian_110/article/details/124953433)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

阅读全文