CommencerCommencer gratuitement

Résumer un long texte

La synthèse permet de réduire un texte volumineux en un contenu plus facile à parcourir, afin d’aider les lecteurs à saisir rapidement les points essentiels d’articles ou de documents longs.

On distingue deux grandes approches : extractive, qui sélectionne des phrases clés du texte d’origine, et abstractive, qui génère de nouvelles phrases résumant les idées principales.

Dans cet exercice, vous allez créer un pipeline de synthèse abstractive avec la fonction pipeline() de Hugging Face et le modèle cnicu/t5-small-booksum. Vous résumerez un texte provenant d’une page Wikipédia sur la Grèce, puis comparerez la reformulation produite par le modèle abstrait au texte original.

La fonction pipeline de la bibliothèque transformers et le original_text ont déjà été chargés pour vous.

Cet exercice fait partie du cours

Travailler avec Hugging Face

Afficher le cours

Instructions

  • Créez le pipeline de synthèse avec la tâche "summarization" et enregistrez-le sous summarizer.
  • Utilisez ce nouveau pipeline pour générer un résumé du texte et enregistrez-le sous summary_text.
  • Comparez la longueur du texte original et celle du résumé.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")

# Summarize the text
summary_text = ____(original_text)

# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")
Modifier et exécuter le code