IniziaInizia gratis

Completare il transformer decoder

È il momento di costruire il corpo del transformer decoder! Dovrai combinare le classi InputEmbeddings, PositionalEncoding e DecoderLayer che hai creato in precedenza.

Questo esercizio fa parte del corso

Modelli Transformer con PyTorch

Visualizza il corso

Istruzioni dell'esercizio

  • Definisci un elenco di num_layers livelli di decoder usando una list comprehension e la classe DecoderLayer.
  • Definisci un livello lineare per proiettare gli hidden state in probabilità sulle parole.
  • Completa il forward pass attraverso i livelli definiti in __init__.
  • Istanzia un transformer decoder e applicalo a input_tokens e tgt_mask.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

class TransformerDecoder(nn.Module):
    def __init__(self, vocab_size, d_model, num_layers, num_heads, d_ff, dropout, max_seq_length):
        super(TransformerDecoder, self).__init__()
        self.embedding = InputEmbeddings(vocab_size, d_model)
        self.positional_encoding = PositionalEncoding(d_model, max_seq_length)
        # Define the list of decoder layers and linear layer
        self.layers = nn.____([____(d_model, num_heads, d_ff, dropout) for _ in range(num_layers)])
        # Define a linear layer to project hidden states to likelihoods
        self.fc = ____
  
    def forward(self, x, tgt_mask):
        # Complete the forward pass
        x = self.____(x)
        x = self.____(x)
        for layer in self.layers:
            x = ____
        x = self.____(x)
        return F.log_softmax(x, dim=-1)

# Instantiate a decoder transformer and apply it to input_tokens and tgt_mask
transformer_decoder = ____(vocab_size, d_model, num_layers, num_heads, d_ff, dropout, max_seq_length)   
output = ____
print(output)
print(output.shape)
Modifica ed esegui il codice