Taalvertaling met een voorgetraind PyTorch-model
Je team bij PyBooks werkt aan een AI-project waarbij teksten van de ene taal naar de andere worden vertaald. Ze willen hiervoor voorgetrainde modellen gebruiken, omdat dat veel trainingstijd en resources kan besparen. In deze oefening stel je een vertaalmodel in uit HuggingFace's Transformers-bibliotheek, specifiek het T5-model (Text-To-Text Transfer Transformer), en gebruik je het om een Engelse zin naar het Frans te vertalen.
T5Tokenizer, T5ForConditionalGeneration zijn alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Deep Learning voor tekst met PyTorch
Oefeninstructies
- Initialiseer de
tokenizeren hetmodelop basis van het voorgetrainde"t5-small"model. - Codeer de invoerprompt met de tokenizer en zorg dat er PyTorch-tensors worden geretourneerd.
- Vertaal de invoerprompt met
modelen genereer de vertaalde output.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Initalize tokenizer and model
tokenizer = ____.from_pretrained("t5-small")
model = ____.from_pretrained("t5-small")
input_prompt = "translate English to French: 'Hello, how are you?'"
# Encode the input prompt using the tokenizer
input_ids = ____.____(input_prompt, return_tensors="____")
# Generate the translated ouput
output = model.____(input_ids, max_length=50)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print("Generated text:",generated_text)