Étapes de préparation à l’entraînement
Avant et pendant l’entraînement d’un modèle spaCy, vous devrez (1) désactiver les autres composants du pipeline afin de n’entraîner que le composant visé et (2) convertir un conteneur Doc d’un point de données d’entraînement et ses annotations correspondantes en une classe Example.
Dans cet exercice, vous allez pratiquer ces deux étapes en utilisant un modèle préchargé en_core_web_sm, accessible via nlp. La classe Example est déjà importée, et une chaîne text ainsi que les annotations associées sont également à votre disposition.
Cet exercice fait partie du cours
Traitement du langage naturel avec spaCy
Instructions
- Désactivez tous les composants du pipeline du modèle
nlpsaufner. - Convertissez une chaîne
textet sesannotationsau format correct utilisable pour l’entraînement.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
nlp = spacy.load("en_core_web_sm")
# Disable all pipeline components of except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)
# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())