Résumer un texte long
Le résumé permet de réduire un texte volumineux en un contenu gérable, ce qui aide les lecteurs à saisir rapidement les points clés d'articles ou de documents volumineux.
Il en existe deux types principaux : l'extractif, qui sélectionne les phrases clés du texte original, et l'abstractif, qui génère de nouvelles phrases résumant les idées principales.
Dans cet exercice, vous allez créer un pipeline de résumé abstractif en utilisant la fonction pipeline() de Hugging Face et le modèle cnicu/t5-small-booksum. Vous résumerez le texte d'une page Wikipédia sur la Grèce, en comparant le résultat de la reformulation du modèle abstractif à l'original.
La fonction pipeline de la bibliothèque transformers et la fonction original_text ont déjà été chargées pour vous.
Cet exercice fait partie du cours
Travailler avec Hugging Face
Instructions
- Créez le résumé
pipelineà l'aide de la tâche "summarization" et enregistrez soussummarizer. - Utilisez le nouveau pipeline pour créer un résumé du texte et sauvegardez-le sous
summary_text. - Comparez la longueur du texte original et du résumé.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")