LoslegenKostenlos loslegen

Kompatible Trainingsdaten

Denk daran: Du kannst den Rohtext nicht direkt an spaCy übergeben. Stattdessen musst du für jedes Trainingsbeispiel ein Example-Objekt erstellen. In dieser Übung wandelst du ein training_data mit einem einzelnen annotierten Satz in eine Liste von Example-Objekten um.

Das Modell en_core_web_sm ist bereits importiert und als nlp verfügbar. Die Klasse Example ist ebenfalls für dich importiert.

Diese Übung ist Teil des Kurses

Natural Language Processing mit spaCy

Kurs anzeigen

Anleitung zur Übung

  • Iteriere durch Text und Annotationen in training_data, wandle den Text in einen Doc-Container um und speichere ihn in doc.
  • Erstelle für jeden Trainingsdatenpunkt ein Example-Objekt mithilfe des doc-Objekts und der zugehörigen Annotationen und speichere es in example_sentence.
  • Hänge example_sentence an eine Liste all_examples an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]

all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
  doc = nlp(____)
  
  # Create an Example object from the doc contianer and annotations
  example_sentence = ____.____(doc, ____)
  print(example_sentence.to_dict(), "\n")
  
  # Append the Example object to the list of all examples
  all_examples.append(____)
  
print("Number of formatted training data: ", len(____))
Code bearbeiten und ausführen