Ajuster la longueur du résumé
La fonction « pipeline() » comporte deux paramètres importants : « min_new_tokens » et « max_new_tokens ». Ces options sont utiles pour ajuster la longueur du texte résumé obtenu afin qu'il soit court, plus long ou qu'il ne dépasse pas un certain nombre de mots. Vous pouvez procéder ainsi si vous disposez d'un espace limité (par exemple, un espace de stockage restreint), pour améliorer la lisibilité ou la qualité du résumé.
Vous allez tester un résumeur court et un résumeur long en définissant ces deux paramètres sur une plage réduite, puis sur une plage plus large.
pipeline Les bibliothèques « transformers » et « original_text » ont déjà été chargées pour vous.
Cet exercice fait partie du cours
Travailler avec Hugging Face
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a short summarizer
short_summarizer = pipeline(task="summarization", model="cnicu/t5-small-booksum", ____=1, ____=10)
# Summarize the input text
short_summary_text = ____(original_text)
# Print the short summary
print(short_summary_text[0]["summary_text"])