MulaiMulai sekarang secara gratis

Data pelatihan yang kompatibel

Ingat bahwa Anda tidak dapat memberikan teks mentah langsung ke spaCy. Sebagai gantinya, Anda perlu membuat objek Example untuk setiap contoh pelatihan. Pada latihan ini, Anda akan berlatih mengonversi training_data dengan satu kalimat beranotasi menjadi daftar objek Example.

Model en_core_web_sm sudah diimpor dan siap digunakan sebagai nlp. Kelas Example juga telah diimpor untuk Anda gunakan.

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Alami dengan spaCy

Lihat Kursus

Petunjuk latihan

  • Iterasikan teks dan anotasi dalam training_data, konversi teks menjadi kontainer Doc dan simpan di doc.
  • Buat objek Example menggunakan objek doc dan anotasi dari setiap titik data pelatihan, lalu simpan di example_sentence.
  • Tambahkan example_sentence ke daftar all_examples.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]

all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
  doc = nlp(____)
  
  # Create an Example object from the doc contianer and annotations
  example_sentence = ____.____(doc, ____)
  print(example_sentence.to_dict(), "\n")
  
  # Append the Example object to the list of all examples
  all_examples.append(____)
  
print("Number of formatted training data: ", len(____))
Edit dan Jalankan Kode