transformer中一般使用mlp还是ffn
时间: 2023-09-20 19:08:53 浏览: 185
transformer中nhead一般设为多少
Transformer中一般使用FFN(Feed-forward network),而不是MLP(多层感知机)。FFN是Transformer中的一层,用于对输入数据进行非线性变换和特征提取,可以帮助模型更好地捕捉序列中的局部和全局信息。相比之下,MLP主要用于对序列进行分类、预测等任务,因此在Transformer模型中使用的较少。
阅读全文