CommencerCommencer gratuitement

Étapes de préparation à l’entraînement

Avant et pendant l’entraînement d’un modèle spaCy, vous devrez (1) désactiver les autres composants du pipeline afin de n’entraîner que le composant visé et (2) convertir un conteneur Doc d’un point de données d’entraînement et ses annotations correspondantes en une classe Example.

Dans cet exercice, vous allez pratiquer ces deux étapes en utilisant un modèle préchargé en_core_web_sm, accessible via nlp. La classe Example est déjà importée, et une chaîne text ainsi que les annotations associées sont également à votre disposition.

Cet exercice fait partie du cours

Traitement du langage naturel avec spaCy

Afficher le cours

Instructions

  • Désactivez tous les composants du pipeline du modèle nlp sauf ner.
  • Convertissez une chaîne text et ses annotations au format correct utilisable pour l’entraînement.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

nlp = spacy.load("en_core_web_sm")

# Disable all pipeline components of  except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)

# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())
Modifier et exécuter le code