Swin-Transfromer
时间: 2024-04-25 20:22:37 浏览: 107
Swin Transformer是一种基于Transformer架构的模型,它引入了分层特征图和转移窗口注意力的概念来解决原始Vision Transformer所面临的问题。这个名字来源于"Shifted window Transformer"。Swin Transformer的整体架构包括多个块,其中第一个块被称为"patch merging",它的操作类似于论文中的"patch partition"。Swin Transformer通过使用分层特征图和移动窗口多头自注意机制(MSA)来解决原始ViT的问题。它已经被广泛应用于各种视觉任务,包括图像分类和对象检测。\[1\]\[2\]\[3\]
#### 引用[.reference_title]
- *1* *2* *3* [Swin-Transformer 详解](https://blog.csdn.net/wangbingqian_110/article/details/124953433)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文