swin transformer原始输入的形状
时间: 2023-10-24 08:31:07 浏览: 96
swin transformer权重
Swin Transformer 的原始输入形状为 `(batch_size, num_patches, hidden_dim)`,其中 `num_patches` 表示图像被分成的 patch 的数量,`hidden_dim` 表示每个 patch 的特征向量的维度。在 Swin Transformer 中,原始图像被分为多个 patch,并且每个 patch 会被看作一个序列,然后传入 Transformer 编码器进行处理。
阅读全文