Traduction automatique avec un modèle PyTorch préentraîné
Votre équipe chez PyBooks travaille sur un projet d’IA qui implique la traduction d’une langue à une autre. Elle souhaite exploiter des modèles préentraînés pour cette tâche, ce qui permet d’économiser beaucoup de temps d’entraînement et de ressources. Dans cet exercice, vous allez configurer un modèle de traduction à partir de la bibliothèque Transformers de HuggingFace, en particulier le modèle T5 (Text-To-Text Transfer Transformer), et l’utiliser pour traduire une phrase anglaise en français.
T5Tokenizer, T5ForConditionalGeneration ont été chargés pour vous.
Cet exercice fait partie du cours
Deep Learning pour le texte avec PyTorch
Instructions
- Initialisez le
tokenizeret lemodelà partir du modèle préentraîné"t5-small". - Encodez l’invite d’entrée avec le tokenizer, en veillant à retourner des tenseurs PyTorch.
- Traduisez l’invite d’entrée avec
modelet générez la sortie traduite.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Initalize tokenizer and model
tokenizer = ____.from_pretrained("t5-small")
model = ____.from_pretrained("t5-small")
input_prompt = "translate English to French: 'Hello, how are you?'"
# Encode the input prompt using the tokenizer
input_ids = ____.____(input_prompt, return_tensors="____")
# Generate the translated ouput
output = model.____(input_ids, max_length=50)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print("Generated text:",generated_text)