首页PyTorch提供的Transformer模块怎么调用

PyTorch提供的Transformer模块怎么调用

时间: 2023-10-14 18:29:04 浏览: 94

PyTorch提供了`nn.Transformer`模块，可以方便地实现Transformer模型。下面是一个简单的例子，展示了如何调用`nn.Transformer`模块： ```python import torch import torch.nn as nn # 定义Transformer模型 class TransformerModel(nn.Module): def __init__(self, input_dim, output_dim, hidden_dim, num_layers, num_heads): super(TransformerModel, self).__init__() self.transformer = nn.Transformer( d_model=hidden_dim, nhead=num_heads, num_encoder_layers=num_layers, num_decoder_layers=num_layers, dim_feedforward=hidden_dim, dropout=0.1, ) self.fc = nn.Linear(hidden_dim, output_dim) def forward(self, src, tgt): out = self.transformer(src, tgt) out = self.fc(out) return out # 定义输入和输出 input_dim = 10 output_dim = 5 batch_size = 16 # 定义输入和输出张量 src = torch.randn(10, batch_size, input_dim) tgt = torch.randn(8, batch_size, input_dim) # 初始化模型 model = TransformerModel(input_dim, output_dim, hidden_dim=64, num_layers=2, num_heads=4) # 进行前向传播 output = model(src, tgt) # 打印输出张量 print(output.shape) ``` 在上面的例子中，我们首先定义了一个`TransformerModel`类，继承自`nn.Module`。在`__init__`方法中，我们调用`nn.Transformer`模块，定义了一个Transformer模型。在`forward`方法中，我们将输入张量`src`和`tgt`传递给Transformer模型，然后将输出张量通过一个线性层进行变换，得到最终的输出结果。在实际使用中，可以根据具体的需求，调整Transformer模块的超参数，例如`d_model`、`nhead`、`num_encoder_layers`和`num_decoder_layers`等参数。通过不断尝试和调整，可以得到更好的模型效果。

阅读全文