Açıklama ve eğitim verisini hazırlama
Veri topladıktan sonra, spaCy modelinin gerektirdiği biçimde verileri açıklayabilirsin. Bu egzersizde, tıbbi alandaki bir Varlık Adı Tanıma (NER) görevi için doğru açıklamalı veri kaydını oluşturmayı pratik edeceksin.
Kullanman için bir sentence ve iki varlık sağlandı: metni chest pain ve türü SYMPTOM olan entity_1, ile metni hyperthyroidism ve türü DISEASE olan entity_2.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
annotated_datakaydını doğru biçimde tamamla.- Her varlığın başlangıç ve bitiş karakterlerini çıkar ve ilgili değişkenlerde sakla.
- Aynı giriş cümlesini ve varlıklarını uygun eğitim biçiminde
training_dataolarak kaydet.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
text = "A patient with chest pain had hyperthyroidism."
entity_1 = "chest pain"
entity_2 = "hyperthyroidism"
# Store annotated data information in the correct format
annotated_data = {"sentence": ____, "entities": [{"label": "SYMPTOM", "value": ____}, {"label": "DISEASE", "value": ____}]}
# Extract start and end characters of each entity
entity_1_start_char = text.____(____)
entity_1_end_char = entity_1_start_char + len(____)
entity_2_start_char = text.____(____)
entity_2_end_char = entity_2_start_char + len(____)
# Store the same input information in the proper format for training
training_data = [(____, {"entities": [(____,____,"SYMPTOM"),
(____,____,"DISEASE")]})]
print(training_data)