CommencerCommencer gratuitement

Traduction automatique avec un modèle PyTorch préentraîné

Votre équipe chez PyBooks travaille sur un projet d’IA qui implique la traduction d’une langue à une autre. Elle souhaite exploiter des modèles préentraînés pour cette tâche, ce qui permet d’économiser beaucoup de temps d’entraînement et de ressources. Dans cet exercice, vous allez configurer un modèle de traduction à partir de la bibliothèque Transformers de HuggingFace, en particulier le modèle T5 (Text-To-Text Transfer Transformer), et l’utiliser pour traduire une phrase anglaise en français.

T5Tokenizer, T5ForConditionalGeneration ont été chargés pour vous.

Cet exercice fait partie du cours

Deep Learning pour le texte avec PyTorch

Afficher le cours

Instructions

  • Initialisez le tokenizer et le model à partir du modèle préentraîné "t5-small".
  • Encodez l’invite d’entrée avec le tokenizer, en veillant à retourner des tenseurs PyTorch.
  • Traduisez l’invite d’entrée avec model et générez la sortie traduite.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initalize tokenizer and model
tokenizer = ____.from_pretrained("t5-small")
model = ____.from_pretrained("t5-small")

input_prompt = "translate English to French: 'Hello, how are you?'"

# Encode the input prompt using the tokenizer
input_ids = ____.____(input_prompt, return_tensors="____")

# Generate the translated ouput
output = model.____(input_ids, max_length=50)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print("Generated text:",generated_text)
Modifier et exécuter le code