Menyusun transformer encoder-decoder
Sekarang setelah Anda memperbarui kelas DecoderLayer, dan perubahan yang setara telah diterapkan pada TransformerDecoder, Anda siap untuk menyatukan semuanya. Karena Anda membangun kelas-kelas secara modular dan hierarkis, Anda hanya perlu menginisialisasi dua di antaranya untuk membangun transformer encoder-decoder: TransformerDecoder dan TransformerEncoder.
Latihan ini adalah bagian dari kursus
Model Transformer dengan PyTorch
Petunjuk latihan
- Lengkapi lintasan
forward()untuk menghitung keluaran encoder dan decoder. - Inisialisasi dan panggil transformer pada
input_tokensdengan menggunakansrc_mask,tgt_mask, dancross_maskyang disediakan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
class Transformer(nn.Module):
def __init__(self, vocab_size, d_model, num_heads, num_layers, d_ff, max_seq_length, dropout):
super().__init__()
self.encoder = TransformerEncoder(vocab_size, d_model, num_layers, num_heads, d_ff, dropout, max_seq_length)
self.decoder = TransformerDecoder(vocab_size, d_model, num_layers, num_heads, d_ff, dropout, max_seq_length)
def forward(self, x, src_mask, tgt_mask, cross_mask):
# Complete the forward pass
encoder_output = self.encoder(____, ____)
decoder_output = self.decoder(____, ____, tgt_mask, cross_mask)
return decoder_output
# Instantiate and call the transformer
transformer = ____(vocab_size, d_model, num_heads, num_layers, d_ff, max_seq_length, dropout)
outputs = ____
print(outputs)
print(outputs.shape)