Resumir textos largos
La resumen reduce textos extensos a contenidos manejables, lo que ayuda a los lectores a captar rápidamente los puntos clave de artículos o documentos largos.
Hay dos tipos principales: extractivo, que selecciona frases clave del texto original, y abstractivo, que genera nuevas frases que resumen las ideas principales.
En este ejercicio, crearás un proceso de resumen abstractivo utilizando la función « pipeline()
» de Hugging Face y el modelo « cnicu/t5-small-booksum
». Resumirás el texto de una página de Wikipedia sobre Grecia, comparando el resultado reformulado por el modelo abstractivo con el original.
La función « pipeline
» de la biblioteca « transformers
» y « original_text
» ya se han cargado por ti.
Este ejercicio forma parte del curso
Trabajar con Hugging Face
Instrucciones del ejercicio
- Crea el resumen «
pipeline
» utilizando la tarea «summarization» y guárdalo como «summarizer
». - Utiliza la nueva canalización para crear un resumen del texto y guárdalo como
summary_text
. - Compara la longitud del texto original y del resumen.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")