主动学习与自训练提升多视角姿态估计效率与精度

0 下载量 130 浏览量 更新于2024-06-20 收藏 762KB PDF 举报
本文主要探讨了一种创新的3D姿态估计方法,结合了主动学习(Active Learning, AL)和自训练技术,旨在提高计算机视觉中人体和手部姿态估计的效率,尤其是在数据标注有限的情况下。姿态估计是计算机视觉领域的一个核心任务,它对于动作识别、社交交互理解和手语解析等应用至关重要。然而,深度神经网络的监督学习方法对大量标注数据的依赖使其成本高昂。 传统的监督学习方法依赖于大规模注释数据,如MPII这样的基准,其创建过程需要大量人力和时间。为了克服这个问题,研究者提出了一种新颖的框架,该框架扩展了单视图主动学习策略,利用多视图几何的优势,有效地挑选出最具价值的样本进行人工标注,从而显著降低标注时间和成本。 文中提出了两种新的主动学习策略,它们在多视图设置中更加高效。同时,将主动学习过程中计算出的伪标签(自我训练的一种形式)融入模型,进一步提升了系统的性能。结果显示,相较于传统的注释流程,他们的方法在CMUPanopticStudio和InterHand2.6M这两个大型基准上实现了显著的性能提升,例如在CMUPanopticStudio上,他们的系统能够将注释周转时间和成本分别减少60%和80%,对于复杂和难以识别的“闭塞”案例,也能保持稳定的高质量估计。 总结来说,这篇文章通过引入主动学习和自训练技术,为3D姿态估计提供了一个更有效、低成本的数据驱动解决方案,为计算机视觉领域中的实时应用开辟了新的可能性。这种方法对于那些对标注资源有限的场景,如移动设备或边缘计算环境,具有重要的实际价值。