Kompatible Trainingsdaten
Denk daran: Du kannst den Rohtext nicht direkt an spaCy übergeben. Stattdessen musst du für jedes Trainingsbeispiel ein Example-Objekt erstellen. In dieser Übung wandelst du ein training_data mit einem einzelnen annotierten Satz in eine Liste von Example-Objekten um.
Das Modell en_core_web_sm ist bereits importiert und als nlp verfügbar. Die Klasse Example ist ebenfalls für dich importiert.
Diese Übung ist Teil des Kurses
Natural Language Processing mit spaCy
Anleitung zur Übung
- Iteriere durch Text und Annotationen in
training_data, wandle den Text in einenDoc-Container um und speichere ihn indoc. - Erstelle für jeden Trainingsdatenpunkt ein
Example-Objekt mithilfe desdoc-Objekts und der zugehörigen Annotationen und speichere es inexample_sentence. - Hänge
example_sentencean eine Listeall_examplesan.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]
all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
doc = nlp(____)
# Create an Example object from the doc contianer and annotations
example_sentence = ____.____(doc, ____)
print(example_sentence.to_dict(), "\n")
# Append the Example object to the list of all examples
all_examples.append(____)
print("Number of formatted training data: ", len(____))