多模态Transformer模型PolyViT:图像、视频与音频的协同训练

需积分: 5 1 下载量 58 浏览量 更新于2024-07-07 收藏 2.23MB PDF 举报
身份认证 购VIP最低享 7 折!
30元优惠券