李沐transformer
时间: 2023-10-26 15:07:11 浏览: 187
transformer
李沐是一位著名的人工智能科学家,他是MXNet深度学习框架的创始人之一。他在2017年发表的一篇论文《Attention Is All You Need》中提出了Transformer模型,这个模型在自然语言处理领域取得了很大的成功。Transformer模型通过使用self-attention机制来处理序列数据,相比于传统的循环神经网络(RNN)模型,Transformer模型能够更好地捕捉长距离依赖关系,从而在机器翻译、文本生成等任务上取得了更好的效果。
阅读全文