Komponenten mit Erweiterungen
Erweiterungsattribute sind besonders mächtig, wenn sie mit eigenen Pipeline-Komponenten kombiniert werden. In dieser Übung schreibst du eine Pipeline-Komponente, die Ländernamen findet, und ein eigenes Erweiterungsattribut, das – falls verfügbar – die Hauptstadt eines Landes zurückgibt.
Das Objekt nlp wurde bereits erstellt und die Klasse Span ist bereits importiert. Ein Phrase-Matcher mit allen Ländern steht als Variable matcher zur Verfügung. Ein Wörterbuch, das Länder ihren Hauptstädten zuordnet, ist als Variable capitals verfügbar.
Diese Übung ist Teil des Kurses
Fortgeschrittenes NLP mit spaCy
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def countries_component(doc):
# Create an entity Span with the label 'GPE' for all matches
doc.ents = [____(____, ____, ____, label=____)
for match_id, start, end in matcher(doc)]
return doc
# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)