Riassumere testi lunghi
Il riassunto riduce testi molto lunghi in contenuti più gestibili, aiutando a cogliere rapidamente i punti chiave di articoli o documenti estesi.
Esistono due tipi principali: estrattivo, che seleziona le frasi chiave dal testo originale, e astrattivo, che genera nuove frasi che sintetizzano le idee principali.
In questo esercizio, creerai una pipeline di riassunto astrattivo usando la funzione pipeline() di Hugging Face e il modello cnicu/t5-small-booksum. Riassumerai un testo tratto da una pagina Wikipedia sulla Grecia, confrontando l’output riformulato del modello astrattivo con l’originale.
La funzione pipeline della libreria transformers e l’original_text sono già stati caricati per te.
Questo esercizio fa parte del corso
Lavorare con Hugging Face
Istruzioni dell'esercizio
- Crea la
pipelinedi riassunto usando il task "summarization" e salvala comesummarizer. - Usa la nuova pipeline per creare un riassunto del testo e salvalo come
summary_text. - Confronta la lunghezza del testo originale e del riassunto.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")