LoslegenKostenlos starten

Kompatible Trainingsdaten

Denk daran: Du kannst den Rohtext nicht direkt an spaCy übergeben. Stattdessen musst du für jedes Trainingsbeispiel ein Example-Objekt erstellen. In dieser Übung wandelst du ein training_data mit einem einzelnen annotierten Satz in eine Liste von Example-Objekten um.

Das Modell en_core_web_sm ist bereits importiert und als nlp verfügbar. Die Klasse Example ist ebenfalls für dich importiert.

Diese Übung ist Teil des Kurses

<Kurs>Natural Language Processing mit spaCy</Kurs>
Kurs ansehen

Übungsanweisungen

  • Iteriere durch Text und Annotationen in training_data, wandle den Text in einen Doc-Container um und speichere ihn in doc.
  • Erstelle für jeden Trainingsdatenpunkt ein Example-Objekt mithilfe des doc-Objekts und der zugehörigen Annotationen und speichere es in example_sentence.
  • Hänge example_sentence an eine Liste all_examples an.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]

all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
  doc = nlp(____)
  
  # Create an Example object from the doc contianer and annotations
  example_sentence = ____.____(doc, ____)
  print(example_sentence.to_dict(), "\n")
  
  # Append the Example object to the list of all examples
  all_examples.append(____)
  
print("Number of formatted training data: ", len(____))
Code bearbeiten und ausführen