Transformers PyTorch
Maintenant que vous connaissez les différents composants de l’architecture Transformer, il est temps d’en définir un ! Le module torch.nn, importé pour vous sous le nom nn, offre une manière très pratique de le faire en seulement quelques lignes de code.
Cet exercice fait partie du cours
<cours>Modèles Transformer avec PyTorch</cours>Instructions de l’exercice
- Définissez un transformer avec
8têtes d’attention,6couches d’encodeur et de décodeur, et des embeddings de séquences d’entrée de longueur1536. - Affichez l’objet du modèle pour voir l’architecture du modèle.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Define the transformer model
model = ____
# Print the model object
print(____)