Swin Transformer 的新型通用图像融合框架
时间: 2023-11-15 15:54:18 浏览: 153
图像融合处理
4星 · 用户满意度95%
Swin Transformer 是一种新型的通用图像融合框架。它在图像分类任务中表现出色,并在计算复杂性相似的情况下取得了显著的提高。与其他视觉 Transformer 模型相比,Swin Transformer 在 Top-1 精度上表现出色,并在多个尺度上优于其他模型。相比于传统的 Transformer 块中插入卷积或使用重叠卷积的方法,Swin Transformer 利用可变形注意力替换了传统的 MHSA,并与 MLP 结合,构建了一个可变形的视觉 Transformer 块。该模型还采用了金字塔结构,适用于需要多尺度特征图的各种视觉任务。
阅读全文