transformer提升性能
时间: 2023-11-17 08:00:43 浏览: 81
选择性注意力提升Transformer性能与效率
引用和提到了transformer在ViT中提升性能的方法,具体包括以下几点:
- 通过简单调节ViT的架构并引入transformer;
- 使用更大的模型和更多的数据;
- 使用更长的训练时间;
- 使用更小的学习率和更长的warm-up时间;
- 使用更好的优化器和正则化方法。
这些方法的综合使用可以提高ViT的性能,使其在56M参数量下可以取得比其他Transformer更佳的性能。
阅读全文