Données d’entraînement compatibles
Rappelez-vous que vous ne pouvez pas fournir le texte brut directement à spaCy. Vous devez créer un objet Example pour chaque exemple d’entraînement. Dans cet exercice, vous allez vous entraîner à convertir un training_data avec une seule phrase annotée en une liste d’objets Example.
Le modèle en_core_web_sm est déjà importé et prêt à l’emploi sous le nom nlp. La classe Example est également importée pour votre usage.
Cet exercice fait partie du cours
Traitement du langage naturel avec spaCy
Instructions
- Parcourez le texte et les annotations dans
training_data, convertissez le texte en conteneurDocet stockez-le dansdoc. - Créez un objet
Exampleen utilisant l’objetdocet les annotations de chaque point de données d’entraînement, et stockez-le dansexample_sentence. - Ajoutez
example_sentenceà une listeall_examples.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]
all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
doc = nlp(____)
# Create an Example object from the doc contianer and annotations
example_sentence = ____.____(doc, ____)
print(example_sentence.to_dict(), "\n")
# Append the Example object to the list of all examples
all_examples.append(____)
print("Number of formatted training data: ", len(____))