transformer的模型结构图
时间: 2023-10-16 14:12:07 浏览: 136
长短期记忆神经网络,transformer模型内部结构详细介绍
Transformer是一种基于自注意力机制的神经网络模型,主要用于序列到序列的任务,如机器翻译、文本摘要等。其模型结构图如下:
![Transformer模型结构图](https://cdn.jsdelivr.net/gh/zyanggc/images/transformer.png)
其中,Encoder由多个相同的层堆叠而成,每个层包含两个子层:Multi-Head Attention和Position-wise Feedforward Neural Networks。Decoder也由多个相同的层堆叠而成,每个层包含三个子层:Masked Multi-Head Attention、Multi-Head Attention和Position-wise Feedforward Neural Networks。
阅读全文