NLTK mit spaCy-NER vergleichen
Mit demselben Text wie in der ersten Übung dieses Kapitels wirst du gleich die Ergebnisse mit spaCys NER-Annotator sehen. Wie schneiden beide im Vergleich ab?
Der Artikel wurde als article vorab geladen. Um die Laufzeit zu minimieren, sollst du beim Laden des spaCy-Modells das Schlüsselwortargument disable=['tagger', 'parser', 'matcher'] angeben, weil dich in dieser Übung nur entity interessiert.
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit Python
Anleitung zur Übung
- Importiere
spacy. - Lade das Modell
'en_core_web_sm'mitspacy.load(). Gib zusätzlich die Schlüsselwortargumentedisable=['tagger', 'parser', 'matcher']an. - Erstelle ein
spacy-Dokumentobjekt, indem duarticleannlp()übergibst. - Verwende
entals Iterationsvariable, iteriere über die Entitäten vondocund gib die Labels (ent.label_) und den Text (ent.text) aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import spacy
____
# Instantiate the English model: nlp
nlp = ____
# Create a new document: doc
doc = ____
# Print all of the found entities and their labels
for ____ in ____:
print(____, ____)