首页Transformer Encoder-Decoder

Transformer Encoder-Decoder

时间: 2024-01-17 09:06:13 浏览: 90

Transformer中的Encoder、Decoder

一、Transformer博客推荐 Transformer源于谷歌公司2017年发表的文章Attention is all you need,Jay Alammar在博客上对文章做了很好的总结：英文版：The Illustrated Transformer CSDN上又博主（于建民）对其进行了很好的中文翻译：中文版：The Illustrated Transformer【译】 Google AI blog写的一篇简述可以作为科普文： Transformer: A Novel Neural Network Architecture for Language Understanding 李宏毅

Transformer Encoder-Decoder是一种基于Transformer架构的模型。它由两个部分组成：编码器（Encoder）和解码器（Decoder）。编码器和解码器都由多个Transformer层组成，每个Transformer层都有多头自注意力机制和前馈神经网络组成。编码器的输入是一个序列，它将序列逐层处理并产生一个固定长度的向量表示，表示输入序列的语义信息。解码器的输入是目标序列的前一个词及编码器产生的向量表示，它逐步生成目标序列。在训练阶段，Transformer Encoder-Decoder使用teacher-forcing策略，即将真实的目标语言序列作为输入，以便更好地训练解码器。在预测阶段，解码器将前一个输出作为下一个输入，直到生成EOS（End of Sequence）标记为止。 Transformer Encoder-Decoder在机器翻译、文本生成、语音识别等自然语言处理任务中表现出色，其优点包括并行化处理、长序列建模、准确性高等。

阅读全文