NoisyStudent: 自我训练提升ImageNet分类精度与鲁棒性
61 浏览量
更新于2024-06-20
收藏 1.11MB PDF 举报
本文主要探讨了一种利用自我训练方法改进ImageNet分类的策略,特别是在提升模型的鲁棒性方面。作者团队提出了一种名为NoisyStudent的创新方法,该方法首先在ImageNet标记数据上训练一个EfficientNet模型,作为教师模型。教师模型在3亿未标记的图像上生成伪标签,这些图像来自Instagram等来源,且大多数与ImageNet训练集分布不符。
伪标签生成阶段,教师模型保持清洁,尽可能地提供准确的信息,而学生模型则在学习过程中引入噪声,如通过RandAugment技术进行辍学、随机深度调整和数据增强。这样做的目的是让学生模型能够更好地泛化,从而在面对多样化的图像数据时表现出更强的鲁棒性。实验结果显示,这种方法显著提高了模型的性能:将ImageNet上的top-1准确率提升到了88.4%,在鲁棒性测试集上,ImageNet-Atop-1准确率从61.0%提升至83.7%,ImageNet-C的平均损坏错误从45.7下降到28.3,ImageNet-P的平均翻转率也从27.8降低到12.2。
这种自我训练策略对于解决深度学习对大量标记数据依赖的问题具有重要意义,展示了如何利用未标记图像来提升现有模型的性能,并且在提升准确性的同时,显著增强了模型在现实世界中的鲁棒性。研究者们在GitHub上提供了模型和代码,以便其他研究人员可以进一步探索和应用这种自我训练技术。
2024-07-22 上传
2019-08-11 上传
2021-04-13 上传
2021-04-24 上传
2022-02-09 上传
2022-08-04 上传
2021-07-23 上传
点击了解资源详情
cpongm
- 粉丝: 5
- 资源: 2万+
最新资源
- MATLAB新功能:Multi-frame ViewRGB制作彩色图阴影
- XKCD Substitutions 3-crx插件:创新的网页文字替换工具
- Python实现8位等离子效果开源项目plasma.py解读
- 维护商店移动应用:基于PhoneGap的移动API应用
- Laravel-Admin的Redis Manager扩展使用教程
- Jekyll代理主题使用指南及文件结构解析
- cPanel中PHP多版本插件的安装与配置指南
- 深入探讨React和Typescript在Alias kopio游戏中的应用
- node.js OSC服务器实现:Gibber消息转换技术解析
- 体验最新升级版的mdbootstrap pro 6.1.0组件库
- 超市盘点过机系统实现与delphi应用
- Boogle: 探索 Python 编程的 Boggle 仿制品
- C++实现的Physics2D简易2D物理模拟
- 傅里叶级数在分数阶微分积分计算中的应用与实现
- Windows Phone与PhoneGap应用隔离存储文件访问方法
- iso8601-interval-recurrence:掌握ISO8601日期范围与重复间隔检查