1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do zpracování přirozeného jazyka v Pythonu

Connected

cvičení

Tvorba grafu

V tomto cvičení použiješ extrahované pojmenované entity a jejich skupiny z řady novinových článků k vizualizaci rozmanitosti typů pojmenovaných entit v těchto článcích.

Budeš pracovat s defaultdict pojmenovaným ner_categories, jehož klíče reprezentují jednotlivé typy skupin pojmenovaných entit a hodnoty počítají výskyt každého typu. K dispozici máš seznam rozdělených vět chunked_sentences podobný předchozímu cvičení, tentokrát však s nebinárními názvy kategorií.

Funkcí hasattr() zjistíš, zda má každý úsek atribut 'label', a jako klíč slovníku pak jednoduše použiješ metodu .label() daného úseku.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Vytvoř defaultdict s názvem ner_categories s výchozím typem nastaveným na int.