vision transformer 超分
时间: 2023-10-14 15:05:54 浏览: 114
视频超分辨
Vision Transformer(ViT)是一种用于计算机视觉任务的架构,最初于2020年推出,并在图像分类、目标检测、视频理解等领域得到广泛应用。ViT的基本思想是将图像分解为一系列局部patch,并使用线性投影将这些patch标记为输入。ViT利用了多头自注意(MHSA)机制,以捕捉图像中不同部分之间的长期关系。
关于Vision Transformer的超分辨率(SR)应用,有一项最新的研究提出了SwinIR,它使用了Swin Transformer来进行图像恢复和超分辨率重建。SwinIR在图像恢复任务上取得了很好的效果,并在2021年的IEEE/CVF国际计算机视觉会议上进行了介绍。
阅读全文