开放世界SSL:基于不确定性伪标签的半监督学习方法

0 下载量 9 浏览量 更新于2024-06-19 收藏 1.11MB PDF 举报
面向现实的半监督学习(Open World SSL)是深度学习在计算机视觉领域的一个重要分支,它旨在克服传统深度学习对大量标注数据的依赖,通过利用未标注数据来增强模型的泛化能力。在标准的SSL方法中,假设未标记数据与有标签数据具有相同的分布,但开放世界SSL则面临一个更具挑战性的问题:未标记数据中可能存在来自未知类别的样本。 本文由Mamshad Nayeem Rizve、Navid Kardan和Mubarak Shah三位研究者提出,他们来自美国UCF计算机视觉研究中心。他们关注的核心是设计一种新的基于伪标签的方法,该方法能够处理开放世界环境中的SSL问题。他们的方法关键在于利用样本的不确定性,即模型对于某些样本的分类信心程度,结合类分布的先验知识,生成既能反映已知类别又能区分未知类别的可信伪标签。 作者通过一系列广泛实验展示了新方法的有效性,特别是在CIFAR-100、ImageNet-100和TinyImageNet等数据集上的显著性能提升。与最先进的技术相比,他们的方法分别实现了1017%、105%和109%的性能提升,显示出在处理大规模数据集和复杂分类任务时的优越性。 此外,他们的研究还强调了在新类发现任务中的灵活性,即模型能够适应并处理未知类别的输入,这在现实世界场景中尤为重要。同时,他们也探讨了模型在处理不平衡数据时的稳定性,确保了即使在类别分布不均的情况下也能保持良好的性能。 文章最后提供了代码链接(<https://github.com/nayeemrizve/TRSSL>),以便读者进一步了解和应用他们的方法。本文的关键点集中在半监督学习的开放世界扩展、不确定性利用、伪标签生成策略以及在实际问题中的应用,这些都是深度学习在计算机视觉领域的重要进展,对推动实际应用具有重要意义。