Resumindo textos longos
A resumização transforma textos grandes em algo mais fácil de lidar, ajudando a gente a entender rapidamente os pontos principais de artigos ou documentos longos.
Existem dois tipos principais: extrativo, que pega frases importantes do texto original, e abstrativo, que cria frases novas que resumem as ideias principais.
Neste exercício, você vai criar um pipeline de resumo abstrato usando a função “ pipeline()
” do Hugging Face e o modelo “ cnicu/t5-small-booksum
”. Você vai resumir um texto de uma página da Wikipedia sobre a Grécia, comparando o resultado reformulado pelo modelo abstrativo com o original.
A função pipeline
da biblioteca transformers
e o original_text
já foram carregados pra você.
Este exercício faz parte do curso
Trabalhando com o Hugging Face
Instruções do exercício
- Crie o resumo “
pipeline
” usando a tarefa “summarization” e salve como “summarizer
”. - Use o novo pipeline para criar um resumo do texto e salve como “
summary_text
”. - Dá uma olhada no tamanho do texto original e do resumo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")