Data pelatihan yang kompatibel
Ingat bahwa Anda tidak dapat memberikan teks mentah langsung ke spaCy. Sebagai gantinya, Anda perlu membuat objek Example untuk setiap contoh pelatihan. Pada latihan ini, Anda akan berlatih mengonversi training_data dengan satu kalimat beranotasi menjadi daftar objek Example.
Model en_core_web_sm sudah diimpor dan siap digunakan sebagai nlp. Kelas Example juga telah diimpor untuk Anda gunakan.
Latihan ini merupakan bagian dari kursus
Pemrosesan Bahasa Alami dengan spaCy
Instruksi latihan
- Iterasikan teks dan anotasi dalam
training_data, konversi teks menjadi kontainerDocdan simpan didoc. - Buat objek
Examplemenggunakan objekdocdan anotasi dari setiap titik data pelatihan, lalu simpan diexample_sentence. - Tambahkan
example_sentenceke daftarall_examples.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]
all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
doc = nlp(____)
# Create an Example object from the doc contianer and annotations
example_sentence = ____.____(doc, ____)
print(example_sentence.to_dict(), "\n")
# Append the Example object to the list of all examples
all_examples.append(____)
print("Number of formatted training data: ", len(____))