transformer用的什么激活函数
时间: 2023-08-10 21:04:25 浏览: 492
关于激活函数
5星 · 资源好评率100%
Transformer模型中使用的激活函数是GELU(Gaussian Error Linear Unit)。GELU激活函数在近年来在自然语言处理任务中表现良好,它通过将输入映射到正态分布上来提供非线性变换。GELU激活函数的定义如下:
```
GELU(x) = 0.5 * x * (1 + tanh(sqrt(2/pi) * (x + 0.044715 * x^3)))
```
其中,`tanh`是双曲正切函数,`sqrt`是平方根函数。
阅读全文