transformer在cv中是怎么发展的,它有哪些变体
时间: 2023-06-11 17:05:02 浏览: 148
第八次组会PPT_Vision in Transformer
5星 · 资源好评率100%
Transformer是一种用于自然语言处理(NLP)任务的神经网络架构,它最初是由Google开发的。在计算机视觉(CV)中,Transformer的应用主要是通过在图像生成和处理过程中使用注意力机制来增加图像的有效信息。 Transformer的一个变体是ViT(Vision Transformer),它将在NLP中使用的Transformer应用于图像分类任务。另一个变体是 DETR(DEtection TRansformer),它是用于对象检测的Transformer架构,其中输入序列可以是对象位置的编码。还有像SE-Net(Squeeze-and-Excitation Network)这样的变体,它通过通道注意力来提高图像的表现力。 总之,Transformer在CV领域的应用不断涌现,其变体也在持续更新和发展。
阅读全文