TSSDL:一种使用Min-Max特征的半监督深度学习方法在DCNN训练中的应用

0 下载量 54 浏览量 更新于2024-06-20 收藏 680KB PDF 举报
"本文提出了一种名为传导式半监督深度学习(TSSDL)的方法,该方法在训练深度卷积神经网络(DCNN)模型时,结合了Min-Max Feature (MMF)正则化。TSSDL利用transductive学习原理处理未标记图像样本,通过引入置信水平来应对异常值和不确定性,同时MMF正则化有助于提升DCNN学习的特征之间的类别间可分性和类别内紧凑性。这种方法独立于特定的DCNN架构,可以与现有的半监督学习(SSL)技术协同工作。在CIFAR10和SVHN基准数据集上的实验结果显示,TSSDL训练的DCNN模型在图像分类精度上与最先进的SSL方法相当,甚至与MeanTeacher方法结合使用时,能在两个数据集上实现最佳分类精度。" 1. 引言 深度卷积神经网络(DCNN)在计算机视觉任务中取得了显著的进步,如图像分类、物体检测、人脸识别和图像检索等。然而,创建大量高质量标注的训练数据集是一项耗时且成本高昂的任务。相比之下,互联网上存在大量未标注图像资源。因此,半监督学习(SSL)成为一种有吸引力的解决方案,它允许使用少量标注数据和大量未标注数据来训练DCNN模型。 2. TSSDL方法 TSSDL的核心在于将transductive学习的概念应用于DCNN训练,它在未标记样本上引入置信度,以处理可能存在的异常或不确定性。这一策略有助于提高模型对未知数据的泛化能力。 3. Min-Max Feature (MMF)正则化 MMF正则化是TSSDL的关键组成部分,它通过优化DCNN学习的特征表示,使得同类样本更加紧凑,不同类样本间更具可分性。这有助于提升模型的分类性能和稳定性。 4. 实验与结果 在CIFAR10和Street View House Numbers (SVHN)数据集上进行的实验展示了TSSDL的有效性。与现有SSL方法相比,TSSDL训练的DCNN模型达到了相匹配的分类精度,而与MeanTeacher结合使用时,性能进一步提升,达到最佳分类效果。 5. 结论 TSSDL提供了一种新的途径来利用未标注数据训练DCNN,其MMF正则化策略增强了模型的鲁棒性和泛化能力。这种方法不仅适用于图像分类,还可能推广到其他需要大量标注数据的领域,如自然语言处理和音频识别等。 关键词: 传导式半监督深度学习,最小-最大特征正则化,深度卷积神经网络,置信水平,半监督学习,图像分类。