Ajuster la longueur du résumé
La fonction pipeline() possède deux paramètres importants : min_new_tokens et max_new_tokens. Ils sont utiles pour ajuster la longueur du résumé obtenu afin qu’il soit court, plus long, ou qu’il respecte une certaine plage de mots. Vous pourriez vouloir le faire en cas de contraintes d’espace (p. ex. faible stockage), pour améliorer la lisibilité ou encore la qualité du résumé.
Vous allez expérimenter un résumé court puis long en définissant ces deux paramètres d’abord sur une plage réduite, puis sur une plage plus large.
pipeline de la bibliothèque transformers et original_text ont déjà été chargés pour vous.
Cet exercice fait partie du cours
Travailler avec Hugging Face
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate a summary of original_text between 1 and 10 tokens
short_summarizer = pipeline(task="summarization", model="cnicu/t5-small-booksum", ____=1, ____=10)
short_summary_text = ____(original_text)
print(short_summary_text[0]["summary_text"])