Construindo o transformer encoder-decoder
Agora que você atualizou a classe DecoderLayer, e as alterações equivalentes foram feitas em TransformerDecoder, é hora de juntar tudo. Como você construiu suas classes de forma modular e hierárquica, só precisa instanciar duas delas para montar o transformer encoder-decoder: TransformerDecoder e TransformerEncoder.
Este exercício faz parte do curso
Modelos Transformer com PyTorch
Instruções do exercício
- Complete a passagem
forward()para calcular as saídas do encoder e do decoder. - Instancie e chame o transformer em
input_tokensusandosrc_mask,tgt_maskecross_maskfornecidas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
class Transformer(nn.Module):
def __init__(self, vocab_size, d_model, num_heads, num_layers, d_ff, max_seq_length, dropout):
super().__init__()
self.encoder = TransformerEncoder(vocab_size, d_model, num_layers, num_heads, d_ff, dropout, max_seq_length)
self.decoder = TransformerDecoder(vocab_size, d_model, num_layers, num_heads, d_ff, dropout, max_seq_length)
def forward(self, x, src_mask, tgt_mask, cross_mask):
# Complete the forward pass
encoder_output = self.encoder(____, ____)
decoder_output = self.decoder(____, ____, tgt_mask, cross_mask)
return decoder_output
# Instantiate and call the transformer
transformer = ____(vocab_size, d_model, num_heads, num_layers, d_ff, max_seq_length, dropout)
outputs = ____
print(outputs)
print(outputs.shape)