BaşlayınÜcretsiz Başlayın

Açıklama ve eğitim verisini hazırlama

Veri topladıktan sonra, spaCy modelinin gerektirdiği biçimde verileri açıklayabilirsin. Bu egzersizde, tıbbi alandaki bir Varlık Adı Tanıma (NER) görevi için doğru açıklamalı veri kaydını oluşturmayı pratik edeceksin.

Kullanman için bir sentence ve iki varlık sağlandı: metni chest pain ve türü SYMPTOM olan entity_1, ile metni hyperthyroidism ve türü DISEASE olan entity_2.

Bu egzersiz

spaCy ile Natural Language Processing

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • annotated_data kaydını doğru biçimde tamamla.
  • Her varlığın başlangıç ve bitiş karakterlerini çıkar ve ilgili değişkenlerde sakla.
  • Aynı giriş cümlesini ve varlıklarını uygun eğitim biçiminde training_data olarak kaydet.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

text = "A patient with chest pain had hyperthyroidism."
entity_1 = "chest pain"
entity_2 = "hyperthyroidism"

# Store annotated data information in the correct format
annotated_data = {"sentence": ____, "entities": [{"label": "SYMPTOM", "value": ____}, {"label": "DISEASE", "value": ____}]}

# Extract start and end characters of each entity
entity_1_start_char = text.____(____)
entity_1_end_char = entity_1_start_char + len(____)
entity_2_start_char = text.____(____)
entity_2_end_char = entity_2_start_char + len(____)

# Store the same input information in the proper format for training
training_data = [(____, {"entities": [(____,____,"SYMPTOM"), 
                                      (____,____,"DISEASE")]})]
print(training_data)
Kodu Düzenle ve Çalıştır