通俗的介绍下Transformer
时间: 2023-11-14 10:43:35 浏览: 56
PyTorch实现基于Transformer的神经机器翻译
5星 · 资源好评率100%
Transformer是一种基于自注意力机制的神经网络结构,最初用于自然语言处理任务中,能够有效捕获输入序列中不同位置的信息。它将输入序列分别映射到“查询”、“键”和“值”向量上,并计算它们之间的相似度,再将相似度作为权重对“值”的加权和进行加权求和,得到新的表示。通过多个这样的层次,Transformer可以在不依赖于循环或卷积操作的情况下,有效地捕获长距离依赖关系,并在机器翻译、文本生成等任务中取得了很好的效果。
阅读全文