1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w Pythonie

Connected

ćwiczenie

Porównanie NER w NLTK i spaCy

Korzystając z tego samego tekstu co w pierwszym ćwiczeniu tego rozdziału, sprawdź teraz wyniki uzyskane za pomocą anotatora NER biblioteki spaCy. Czy będą się różnić?

Artykuł jest już wczytany jako article. Aby skrócić czas wykonania, przy ładowaniu modelu spaCy podaj argument kluczowy disable=['tagger', 'parser', 'matcher'] – w tym ćwiczeniu interesują cię wyłącznie encje (entity).

Instrukcje

100 XP
  • Zaimportuj spacy.
  • Wczytaj model 'en_core_web_sm' za pomocą spacy.load(). Podaj dodatkowe argumenty kluczowe disable=['tagger', 'parser', 'matcher'].
  • Utwórz obiekt dokumentu spaCy, przekazując article do nlp().
  • Używając ent jako zmiennej iteracyjnej, przejdź po encjach obiektu doc i wypisz etykiety (ent.label_) oraz tekst (ent.text).