1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Working with Hugging Face

Connected

cvičení

Shrnutí dlouhého textu

Sumarizace redukuje rozsáhlý text na přehledný obsah a pomáhá čtenářům rychle pochopit klíčové myšlenky z dlouhých článků nebo dokumentů.

Existují dva hlavní typy: extraktivní, který vybírá klíčové věty přímo z původního textu, a abstraktivní, který generuje nové věty shrnující hlavní myšlenky.

V tomto cvičení vytvoříš pipeline pro abstraktivní sumarizaci pomocí funkce pipeline() z Hugging Face a modelu cnicu/t5-small-booksum. Shrneš text z wikipedie o Řecku a porovnáš přeformulovaný výstup abstraktivního modelu s originálem.

Funkce pipeline z knihovny transformers a proměnná original_text jsou už načtené.

Pokyny

100 XP
  • Vytvoř sumarizační pipeline s úlohou "summarization" a ulož ji jako summarizer.
  • Pomocí nové pipeline vytvoř souhrn textu a ulož ho jako summary_text.
  • Porovnej délku původního textu a souhrnu.