LoslegenKostenlos starten

Komponenten mit Erweiterungen

Erweiterungsattribute sind besonders mächtig, wenn sie mit eigenen Pipeline-Komponenten kombiniert werden. In dieser Übung schreibst du eine Pipeline-Komponente, die Ländernamen findet, und ein eigenes Erweiterungsattribut, das – falls verfügbar – die Hauptstadt eines Landes zurückgibt.

Das Objekt nlp wurde bereits erstellt und die Klasse Span ist bereits importiert. Ein Phrase-Matcher mit allen Ländern steht als Variable matcher zur Verfügung. Ein Wörterbuch, das Länder ihren Hauptstädten zuordnet, ist als Variable capitals verfügbar.

Diese Übung ist Teil des Kurses

<Kurs>Fortgeschrittenes NLP mit spaCy</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

def countries_component(doc):
    # Create an entity Span with the label 'GPE' for all matches
    doc.ents = [____(____, ____, ____, label=____)
                for match_id, start, end in matcher(doc)]
    return doc

# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)
Code bearbeiten und ausführen