Data pelatihan yang kompatibel
Ingat bahwa Anda tidak dapat memberikan teks mentah langsung ke spaCy. Sebagai gantinya, Anda perlu membuat objek Example untuk setiap contoh pelatihan. Pada latihan ini, Anda akan berlatih mengonversi training_data dengan satu kalimat beranotasi menjadi daftar objek Example.
Model en_core_web_sm sudah diimpor dan siap digunakan sebagai nlp. Kelas Example juga telah diimpor untuk Anda gunakan.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Alami dengan spaCy
Petunjuk latihan
- Iterasikan teks dan anotasi dalam
training_data, konversi teks menjadi kontainerDocdan simpan didoc. - Buat objek
Examplemenggunakan objekdocdan anotasi dari setiap titik data pelatihan, lalu simpan diexample_sentence. - Tambahkan
example_sentenceke daftarall_examples.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]
all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
doc = nlp(____)
# Create an Example object from the doc contianer and annotations
example_sentence = ____.____(doc, ____)
print(example_sentence.to_dict(), "\n")
# Append the Example object to the list of all examples
all_examples.append(____)
print("Number of formatted training data: ", len(____))