半监督transformer
时间: 2023-09-08 13:17:29 浏览: 219
半监督transformer是一种基于Transformer的半监督学习方法,用于动作识别任务。该方法利用稳定的伪标签框架(即 EMA-Teacher)处理未标记的视频样本,并引入了一种新颖的增强策略,称为Tube TokenMix。Tube TokenMix通过在视频剪辑中进行掩码混合,在时间轴上具有一致的掩码token,以模拟token之间的时序相关性。此外,半监督transformer还采用了一种时间扭曲增强(TWAug),可以任意改变时间片段中每一帧的长度,以覆盖视频中复杂的时间变化。通过在多个公开的视频数据集上进行实验验证,半监督transformer证明了其在动作识别任务上的优势。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [文本分类半监督学习问题(二)](https://blog.csdn.net/weixin_50109501/article/details/120691613)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* *3* [SVFormer:走进半监督动作识别的视觉 Transformer](https://blog.csdn.net/weixin_44839084/article/details/129082450)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文