transformer 过拟合
时间: 2023-09-09 20:12:30 浏览: 114
过拟合问题1
过拟合是指模型在训练集上表现良好,但在测试集上表现不佳的现象。针对Transformer模型的过拟合问题,美图影像研究院(MT Lab)与中国科学院大学提出了一种新颖的正则化方法,称为DropKey。该方法通过在注意力计算阶段随机drop部分Key,从而鼓励网络捕获目标对象的全局信息,避免过于聚焦于局部信息所引发的模型偏置问题,以提高基于Transformer的视觉类算法的精度。
此外,论文中还提到尝试了基于块窗口和交叉窗口的结构化Drop方式,但发现这种技巧对于Vision Transformer来说并不重要,即不需要像CNN一样进行结构化Drop操作。因此,DropKey正则化方法可以作为一种有效的手段来缓解Transformer模型的过拟合问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [CVPR 2023|两行代码高效缓解视觉Transformer过拟合,美图&国科大联合提出正则化方法DropKey...](https://blog.csdn.net/moxibingdao/article/details/130097550)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文