Évaluation de la perplexité
Essayez de générer du texte et d'évaluer le score de perplexité.
On vous a fourni un certain input_text
qui est le début d'une phrase : "Les tendances actuelles montrent que d'ici 2030 ".
Utilisez LLM pour générer le reste de la phrase.
Un modèle AutoModelForCausalLM
et son tokenizer ont été chargés pour vous en tant que variables model
et tokenizer
.
Cet exercice fait partie du cours
Introduction aux LLM en Python
Instructions
- Encodez le site
input_text
et transmettez-le au modèle de génération de texte fourni. - Chargez et calculez le score
mean_perplexity
sur le texte généré.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Encode the input text, generate and decode it
input_text_ids = ____(input_text, return_tensors="pt")
output = ____(input_text_ids, max_length=20)
generated_text = ____(output[0], skip_special_tokens=True)
print("Generated Text: ", generated_text)
# Load and compute the perplexity score
perplexity = ____("perplexity", module_type="metric")
results = ____(model_id="gpt2", predictions=____)
print("Perplexity: ", results['mean_perplexity'])