Porovnání NER v NLTK a spaCy

Teď použiješ stejný text jako v prvním cvičení této kapitoly a podíváš se, jaké výsledky přinese NER anotátor ze spaCy. Jak si budou obě metody stát?

Článek je předem načtený jako article. Aby se zkrátila doba výpočtu, při načítání modelu spaCy zadej klíčový argument disable=['tagger', 'parser', 'matcher'] — v tomto cvičení tě zajímají pouze entity.

Importuj spacy.
Načti model 'en_core_web_sm' pomocí spacy.load(). Zadej dodatečné klíčové argumenty disable=['tagger', 'parser', 'matcher'].
Vytvoř dokument spaCy tak, že předáš article do funkce nlp().
Jako proměnnou iterátoru použij ent, projdi entity objektu doc a vypiš jejich štítky (ent.label_) a text (ent.text).

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení