1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do zpracování přirozeného jazyka v Pythonu

Connected

cvičení

Porovnání NER v NLTK a spaCy

Teď použiješ stejný text jako v prvním cvičení této kapitoly a podíváš se, jaké výsledky přinese NER anotátor ze spaCy. Jak si budou obě metody stát?

Článek je předem načtený jako article. Aby se zkrátila doba výpočtu, při načítání modelu spaCy zadej klíčový argument disable=['tagger', 'parser', 'matcher'] — v tomto cvičení tě zajímají pouze entity.

Pokyny

100 XP
  • Importuj spacy.
  • Načti model 'en_core_web_sm' pomocí spacy.load(). Zadej dodatečné klíčové argumenty disable=['tagger', 'parser', 'matcher'].
  • Vytvoř dokument spaCy tak, že předáš article do funkce nlp().
  • Jako proměnnou iterátoru použij ent, projdi entity objektu doc a vypiš jejich štítky (ent.label_) a text (ent.text).