Stappen ter voorbereiding van training
Vóór en tijdens het trainen van een spaCy-model moet je (1) andere pipeline-onderdelen uitschakelen zodat je alleen de beoogde component traint en (2) een Doc-container van een trainingsdatapunt en de bijbehorende annotations omzetten naar een Example-klasse.
In deze oefening oefen je deze twee stappen met een voorgeladen model en_core_web_sm, beschikbaar als nlp. De klasse Example is al geïmporteerd en een text-string en bijbehorende annotations zijn ook beschikbaar.
Deze oefening maakt deel uit van de cursus
Natural Language Processing met spaCy
Oefeninstructies
- Schakel alle pipeline-onderdelen van het
nlp-model uit, behalvener. - Zet een
text-string en deannotationsom naar het juiste formaat dat bruikbaar is voor training.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
nlp = spacy.load("en_core_web_sm")
# Disable all pipeline components of except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)
# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())