NLTK mit spaCy-NER vergleichen
Mit demselben Text wie in der ersten Übung dieses Kapitels wirst du gleich die Ergebnisse mit spaCys NER-Annotator sehen. Wie schneiden beide im Vergleich ab?
Der Artikel wurde als article vorab geladen. Um die Laufzeit zu minimieren, sollst du beim Laden des spaCy-Modells das Schlüsselwortargument disable=['tagger', 'parser', 'matcher'] angeben, weil dich in dieser Übung nur entity interessiert.
Diese Übung ist Teil des Kurses
<Kurs>Einführung in Natural Language Processing mit Python</Kurs>Übungsanweisungen
- Importiere
spacy. - Lade das Modell
'en_core_web_sm'mitspacy.load(). Gib zusätzlich die Schlüsselwortargumentedisable=['tagger', 'parser', 'matcher']an. - Erstelle ein
spacy-Dokumentobjekt, indem duarticleannlp()übergibst. - Verwende
entals Iterationsvariable, iteriere über die Entitäten vondocund gib die Labels (ent.label_) und den Text (ent.text) aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import spacy
____
# Instantiate the English model: nlp
nlp = ____
# Create a new document: doc
doc = ____
# Print all of the found entities and their labels
for ____ in ____:
print(____, ____)