在线标签平滑:深度提升深度神经网络性能

需积分: 49 0 下载量 135 浏览量 更新于2024-08-11 收藏 1.32MB PDF 举报
"《深入探讨标签平滑:一种改进的深度学习正则化方法》(Delving Deep into Label Smoothing)是一篇发表在《AT EXCLASSFILES》第14卷第8期的论文,主要关注于深度神经网络(DNNs)中的一个重要技术——标签平滑。标签平滑是一种有效的正则化手段,通过将硬标签(one-hot编码)与均匀分布进行加权平均,生成软标签,以此来减少深度模型在训练过程中的过拟合问题,并提升分类性能。 传统的标签平滑策略通常假设所有非目标类别具有相同的概率,这可能并不完全反映模型预测的真实置信度。论文作者Chang-Bin Zhang、Peng-Tao Jiang、Qibin Hou等人提出了一种名为在线标签平滑(Online Label Smoothing, OLS)的新策略。OLS利用模型对目标类别的预测统计信息动态调整软标签,使生成的概率分布更合理,既能区分目标类别与其他非目标类别的相对重要性,又能在训练过程中提供更为精确的指导。 实验结果显示,在CIFAR-100、ImageNet等大规模图像识别数据集以及细粒度分类任务上,基于OLS的标签平滑方法相较于传统方法,能显著提高模型的分类准确性和泛化能力。这种方法的优势在于它能够根据模型实际表现调整标签,从而更好地适应各种复杂的数据分布和任务需求。因此,Online Label Smoothing为深度学习模型的优化提供了新的视角和实用工具,对于提升深度学习模型的性能具有重要的理论价值和实践意义。"