video-swin-transformer
时间: 2023-08-20 20:09:41 浏览: 236
video_transformer
Video Swin Transformer是一种基于Swin Transformer的视频领域应用模型。它是通过在Swin Transformer的基础上添加时间维度来处理视频数据的。在Video Swin Transformer中,注意力机制和窗口构建与传统的Swin Transformer略有不同。该模型的官方实现可以在GitHub上找到\[1\]。关于Video Swin Transformer的更多解读和详细信息可以参考引用\[2\]中提供的资料,包括论文精读、网络结构详解和从零开始的解读\[2\]\[3\]\[4\]。
#### 引用[.reference_title]
- *1* [[Video Transformer] Video Swin Transformer](https://blog.csdn.net/weixin_46746665/article/details/122567590)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* *3* [论文阅读 - Video Swin Transformer](https://blog.csdn.net/zjuPeco/article/details/122860198)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文