ComeçarComece de graça

Construindo o transformer encoder-decoder

Agora que você atualizou a classe DecoderLayer, e as alterações equivalentes foram feitas em TransformerDecoder, é hora de juntar tudo. Como você construiu suas classes de forma modular e hierárquica, só precisa instanciar duas delas para montar o transformer encoder-decoder: TransformerDecoder e TransformerEncoder.

Este exercício faz parte do curso

Modelos Transformer com PyTorch

Ver curso

Instruções do exercício

  • Complete a passagem forward() para calcular as saídas do encoder e do decoder.
  • Instancie e chame o transformer em input_tokens usando src_mask, tgt_mask e cross_mask fornecidas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

class Transformer(nn.Module):
    def __init__(self, vocab_size, d_model, num_heads, num_layers, d_ff, max_seq_length, dropout):
        super().__init__()
        self.encoder = TransformerEncoder(vocab_size, d_model, num_layers, num_heads, d_ff, dropout, max_seq_length)
        self.decoder = TransformerDecoder(vocab_size, d_model, num_layers, num_heads, d_ff, dropout, max_seq_length)

    def forward(self, x, src_mask, tgt_mask, cross_mask):
        # Complete the forward pass
        encoder_output = self.encoder(____, ____)
        decoder_output = self.decoder(____, ____, tgt_mask, cross_mask)
        return decoder_output

# Instantiate and call the transformer
transformer = ____(vocab_size, d_model, num_heads, num_layers, d_ff, max_seq_length, dropout)
outputs = ____
print(outputs)
print(outputs.shape)
Editar e executar o código