transformer文献推荐
时间: 2023-09-17 22:09:28 浏览: 202
当然,我可以给你一些 Transformer 相关的经典文献推荐。以下是一些著名的 Transformer 相关论文:
1. "Attention Is All You Need" by Vaswani, et al. (2017)
这是最早提出 Transformer 模型的论文,引入了自注意力机制,并在机器翻译任务上取得了非常好的效果。
2. "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding" by Devlin, et al. (2018)
这篇论文介绍了 BERT 模型,它是基于 Transformer 的预训练模型,通过大规模无监督学习在多种下游任务上取得了很好的表现。
3. "XLNet: Generalized Autoregressive Pretraining for Language Understanding" by Yang, et al. (2019)
这篇论文提出了 XLNet 模型,它在 BERT 模型的基础上引入了排列语言模型(permutation language modeling)的思想,显著改进了预训练表现。
4. "GPT-1: Improving Language Understanding by Generative Pre-Training" by Radford, et al. (2018)
这篇论文介绍了 GPT-1 模型,它是基于 Transformer 的生成式预训练模型,通过自回归训练在语言理解任务上取得了显著进展。
5. "GPT-2: Language Models are Unsupervised Multitask Learners" by Radford, et al. (2019)
这篇论文介绍了 GPT-2 模型,它在 GPT-1 的基础上扩展了模型规模和训练数据,取得了更好的生成效果。
这些论文都是 Transformer 领域的经典之作,可以帮助你深入理解 Transformer 模型的原理和应用。希望对你有所帮助!
阅读全文
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![-](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)