Résumer un texte long
La synthèse réduit les textes volumineux en un contenu gérable, aidant ainsi les lecteurs à saisir rapidement les points essentiels d'articles ou de documents longs.
Il existe deux principaux types : l'extraction, qui sélectionne des phrases clés du texte original, et l'abstraction, qui génère de nouvelles phrases résumant les idées principales.
Dans cet exercice, vous allez créer un pipeline de résumé abstrait à l'aide de la fonction « pipeline() » de Hugging Face et du modèle « cnicu/t5-small-booksum ». Vous résumerez le texte d'une page Wikipédia sur la Grèce, en comparant la reformulation du modèle abstrait avec le texte original.
La fonction pipeline de la bibliothèque transformers et la variable original_text ont déjà été chargées pour vous.
Cet exercice fait partie du cours
Travailler avec Hugging Face
Instructions
- Créez l'
pipelinede synthèse à l'aide de la tâche « synthèse » et enregistrez-la sous le nom «summarizer». - Veuillez utiliser le nouveau pipeline pour créer un résumé du texte et enregistrez-le sous le nom «
summary_text». - Veuillez comparer la longueur du texte original et celle du résumé.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")