Komplexe Komponenten
In dieser Übung schreibst du eine benutzerdefinierte Komponente, die den PhraseMatcher verwendet, um Tiernamen im Dokument zu finden, und die gefundenen Spans zu doc.ents hinzufügt.
Ein PhraseMatcher mit den Tiermustern wurde bereits als Variable matcher erstellt. Das kleine englische Modell ist als Variable nlp verfügbar. Das Span-Objekt wurde bereits für dich importiert.
Diese Übung ist Teil des Kurses
Fortgeschrittenes NLP mit spaCy
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define the custom component
def animal_component(doc):
# Apply the matcher to the doc
matches = ____
# Create a Span for each match and assign the label 'ANIMAL'
spans = [Span(____, ____, ___, label=____)
for match_id, start, end in matches]
# Overwrite the doc.ents with the matched spans
doc.ents = spans
return doc