鲁棒锚点嵌入:无监督视频人物识别新框架

0 下载量 149 浏览量 更新于2024-06-20 收藏 1.03MB PDF 举报
"鲁棒锚点嵌入:无监督视频人物识别中的应用" 鲁棒锚点嵌入(Robust Anchor Embedding,RACE)是一种在无监督视频人物识别任务中解决标签不均衡和数据不确定性问题的新方法。无监督视频人物识别,即re-ID,旨在在没有标注的情况下,识别和匹配在不同摄像头视图中出现的同一个人。在实际场景中,由于数据采集的限制,往往存在大量的未标记数据,并且这些数据在不同摄像头间的分布往往是不平衡的,即某些人在一个摄像头中频繁出现,而在其他摄像头中可能只出现一次或根本不出现。 RACE框架通过深度特征表示学习,对大规模无监督视频re-ID进行优化。首先,选择代表不同个体的锚序列来构建锚图,这个锚图用于初始化卷积神经网络(CNN)模型,以便生成区分性的特征表示。锚点的选择是关键,它们应该能够捕获个体的独特特征,同时减少噪声和误匹配的可能性。 接着,RACE利用正则化仿射壳在鲁棒锚点嵌入的基础上估计未标记序列和噪声帧的标签。这种方法假设数据存在于某种流形结构中,通过k个最近邻(k-NN)锚点嵌入来保持计算效率,同时保持对数据复杂性的敏感性。k-NN锚点嵌入策略减少了对整个锚点集的依赖,降低了计算复杂度,提高了预测准确性。 然后,RACE提出了一种鲁棒且高效的top-k计数标签预测策略。这种策略可以预测未标记图像序列的标签,利用新估计的标记序列来促进特征学习过程。通过这种方式,即使在标签不均衡和数据噪声的条件下,也能逐步改进特征表示的质量。 实验结果显示,RACE方法在大规模数据集上优于现有的无监督视频识别方法。这表明,该框架能够有效地应对实际无监督re-ID任务中的挑战,如数据不平衡和不确定性,为无监督视频人物识别提供了一个强大且实用的解决方案。 关键词:无监督人re-ID,鲁棒锚点嵌入,特征表示学习,无监督视频识别,正则化仿射壳,k-NN锚点嵌入,top-k计数标签预测 在实际应用中,无监督re-ID方法的灵活性和适应性使其成为解决大规模相机网络中行人重识别问题的理想选择。通过RACE,我们可以利用未标注的视频数据,无需人工标注,训练出具有竞争力的识别模型,这对于监控系统和其他相关领域的自动识别技术有着重要的推进作用。