Aan de slagGa gratis aan de slag

Taalvertaling met een voorgetraind PyTorch-model

Je team bij PyBooks werkt aan een AI-project waarbij teksten van de ene taal naar de andere worden vertaald. Ze willen hiervoor voorgetrainde modellen gebruiken, omdat dat veel trainingstijd en resources kan besparen. In deze oefening stel je een vertaalmodel in uit HuggingFace's Transformers-bibliotheek, specifiek het T5-model (Text-To-Text Transfer Transformer), en gebruik je het om een Engelse zin naar het Frans te vertalen.

T5Tokenizer, T5ForConditionalGeneration zijn alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Deep Learning voor tekst met PyTorch

Cursus bekijken

Oefeninstructies

  • Initialiseer de tokenizer en het model op basis van het voorgetrainde "t5-small" model.
  • Codeer de invoerprompt met de tokenizer en zorg dat er PyTorch-tensors worden geretourneerd.
  • Vertaal de invoerprompt met model en genereer de vertaalde output.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Initalize tokenizer and model
tokenizer = ____.from_pretrained("t5-small")
model = ____.from_pretrained("t5-small")

input_prompt = "translate English to French: 'Hello, how are you?'"

# Encode the input prompt using the tokenizer
input_ids = ____.____(input_prompt, return_tensors="____")

# Generate the translated ouput
output = model.____(input_ids, max_length=50)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print("Generated text:",generated_text)
Code bewerken en uitvoeren