Komponenten mit Erweiterungen
Erweiterungsattribute sind besonders mächtig, wenn sie mit eigenen Pipeline-Komponenten kombiniert werden. In dieser Übung schreibst du eine Pipeline-Komponente, die Ländernamen findet, und ein eigenes Erweiterungsattribut, das – falls verfügbar – die Hauptstadt eines Landes zurückgibt.
Das Objekt nlp wurde bereits erstellt und die Klasse Span ist bereits importiert. Ein Phrase-Matcher mit allen Ländern steht als Variable matcher zur Verfügung. Ein Wörterbuch, das Länder ihren Hauptstädten zuordnet, ist als Variable capitals verfügbar.
Diese Übung ist Teil des Kurses
<Kurs>Fortgeschrittenes NLP mit spaCy</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def countries_component(doc):
# Create an entity Span with the label 'GPE' for all matches
doc.ents = [____(____, ____, ____, label=____)
for match_id, start, end in matcher(doc)]
return doc
# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)