CommencerCommencer gratuitement

Données d’entraînement compatibles

Rappelez-vous que vous ne pouvez pas fournir le texte brut directement à spaCy. Vous devez créer un objet Example pour chaque exemple d’entraînement. Dans cet exercice, vous allez vous entraîner à convertir un training_data avec une seule phrase annotée en une liste d’objets Example.

Le modèle en_core_web_sm est déjà importé et prêt à l’emploi sous le nom nlp. La classe Example est également importée pour votre usage.

Cet exercice fait partie du cours

Traitement du langage naturel avec spaCy

Afficher le cours

Instructions

  • Parcourez le texte et les annotations dans training_data, convertissez le texte en conteneur Doc et stockez-le dans doc.
  • Créez un objet Example en utilisant l’objet doc et les annotations de chaque point de données d’entraînement, et stockez-le dans example_sentence.
  • Ajoutez example_sentence à une liste all_examples.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]

all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
  doc = nlp(____)
  
  # Create an Example object from the doc contianer and annotations
  example_sentence = ____.____(doc, ____)
  print(example_sentence.to_dict(), "\n")
  
  # Append the Example object to the list of all examples
  all_examples.append(____)
  
print("Number of formatted training data: ", len(____))
Modifier et exécuter le code