IniziaInizia gratis

Riassumere testi lunghi

Il riassunto riduce testi molto lunghi in contenuti più gestibili, aiutando a cogliere rapidamente i punti chiave di articoli o documenti estesi.

Esistono due tipi principali: estrattivo, che seleziona le frasi chiave dal testo originale, e astrattivo, che genera nuove frasi che sintetizzano le idee principali.

In questo esercizio, creerai una pipeline di riassunto astrattivo usando la funzione pipeline() di Hugging Face e il modello cnicu/t5-small-booksum. Riassumerai un testo tratto da una pagina Wikipedia sulla Grecia, confrontando l’output riformulato del modello astrattivo con l’originale.

La funzione pipeline della libreria transformers e l’original_text sono già stati caricati per te.

Questo esercizio fa parte del corso

Lavorare con Hugging Face

Visualizza il corso

Istruzioni dell'esercizio

  • Crea la pipeline di riassunto usando il task "summarization" e salvala come summarizer.
  • Usa la nuova pipeline per creare un riassunto del testo e salvalo come summary_text.
  • Confronta la lunghezza del testo originale e del riassunto.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")

# Summarize the text
summary_text = ____(original_text)

# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")
Modifica ed esegui il codice