时空 transformer
时间: 2023-08-22 08:07:38 浏览: 108
时空Transformer是一种基于Transformer架构,用于视频理解和场景理解的方法。它是第一个完全基于Transformer的视频架构,已经在自然语言处理应用程序中得到广泛应用,如机器翻译和通用语言理解。它利用时空上下文来生成动态场景图,可以提高视频理解的准确性和效率。与传统的3D CNN相比,时空Transformer在训练速度上有更高的效率,提速了3倍,并且具有更高的视频剪辑上限,可以处理几分钟的视频剪辑。这使得时空Transformer成为视频理解领域的重要研究方向,具有更高的性能和更低的成本。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *3* [本周AI热点回顾:「时空版」Transformer训练速度远超3D CNN;拒绝内卷的AI狼火了!不想抓羊只想躺!...](https://blog.csdn.net/PaddlePaddle/article/details/115059506)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"]
- *2* [ICCV 2021 | STTran:用于视频场景图生成的时空上下文Transformer](https://blog.csdn.net/amusi1994/article/details/119225470)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文