Aan de slagGa gratis aan de slag

Stappen ter voorbereiding van training

Vóór en tijdens het trainen van een spaCy-model moet je (1) andere pipeline-onderdelen uitschakelen zodat je alleen de beoogde component traint en (2) een Doc-container van een trainingsdatapunt en de bijbehorende annotations omzetten naar een Example-klasse.

In deze oefening oefen je deze twee stappen met een voorgeladen model en_core_web_sm, beschikbaar als nlp. De klasse Example is al geïmporteerd en een text-string en bijbehorende annotations zijn ook beschikbaar.

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

Cursus bekijken

Oefeninstructies

  • Schakel alle pipeline-onderdelen van het nlp-model uit, behalve ner.
  • Zet een text-string en de annotations om naar het juiste formaat dat bruikbaar is voor training.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

nlp = spacy.load("en_core_web_sm")

# Disable all pipeline components of  except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)

# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())
Code bewerken en uitvoeren