Aan de slagGa gratis aan de slag

Complexe componenten

In deze oefening schrijf je een aangepaste component die de PhraseMatcher gebruikt om dierennamen in het document te vinden en de overeenkomende spans toevoegt aan doc.ents.

Er is al een PhraseMatcher met de dierenpatronen aangemaakt als de variabele matcher. Het kleine Engelse model is beschikbaar als de variabele nlp. Het Span-object is al voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Geavanceerde NLP met spaCy

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define the custom component
def animal_component(doc):
    # Apply the matcher to the doc
    matches = ____
    # Create a Span for each match and assign the label 'ANIMAL'
    spans = [Span(____, ____, ___, label=____)
             for match_id, start, end in matches]
    # Overwrite the doc.ents with the matched spans
    doc.ents = spans
    return doc
Code bewerken en uitvoeren