Tradução de idiomas com modelo PyTorch pré-treinado
Sua equipe na PyBooks está trabalhando em um projeto de IA que envolve tradução de um idioma para outro. Eles querem aproveitar modelos pré-treinados para essa tarefa, o que pode economizar muito tempo de treinamento e recursos. A tarefa deste exercício é configurar um modelo de tradução da biblioteca Transformers, da HuggingFace, especificamente o modelo T5 (Text-To-Text Transfer Transformer), e usá-lo para traduzir uma frase em inglês para francês.
T5Tokenizer, T5ForConditionalGeneration já foram carregados para você.
Este exercício faz parte do curso
Deep Learning para Texto com PyTorch
Instruções do exercício
- Inicialize o
tokenizere omodela partir do modelo pré-treinado"t5-small". - Codifique o prompt de entrada usando o tokenizer, garantindo que retorne tensores do PyTorch.
- Traduza o prompt de entrada usando o
modele gere a saída traduzida.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Initalize tokenizer and model
tokenizer = ____.from_pretrained("t5-small")
model = ____.from_pretrained("t5-small")
input_prompt = "translate English to French: 'Hello, how are you?'"
# Encode the input prompt using the tokenizer
input_ids = ____.____(input_prompt, return_tensors="____")
# Generate the translated ouput
output = model.____(input_ids, max_length=50)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print("Generated text:",generated_text)