Verilerinde model performansı
Bu egzersizde, mevcut bir modeli kendi verilerin üzerinde değerlendirmeyi pratik edeceksin. Bu durumda amaç, belirli bir varlık etiketi olan PRODUCT üzerinde model performansını incelemek. Bir model, PRODUCT varlıklarının büyük bir yüzdesini (ör. %75’ten fazla) doğru sınıflandırabiliyorsa, modeli PRODUCT varlık örnekleriyle eğitmen gerekmez; aksi halde, PRODUCT varlığı tahminindeki performansını artırmak için modeli eğitmeyi düşünmelisin.
Bu egzersiz için Amazon Fine Food Reviews veri kümesinden iki yorumu kullanacaksın. Bu yorumlara texts listesiyle erişebilirsin.
en_core_web_sm modeli senin için zaten yüklendi. nlp() çağırarak erişebilirsin. Model texts listesi üzerinde zaten çalıştırıldı ve kullanımın için Doc kapsayıcılarından oluşan documents listesi hazır.
Bu egzersiz, kursun bir parçasıdır
spaCy ile Natural Language Processing
Egzersiz talimatları
- Her bir
documentsöğesi için tüm varlıkları içeren birtarget_entitieslistesi derle ve yalnızca varlık metni içindeJumbogeçiyorsa (varlık metni, varlık etiketi) şeklinde bir demeti (tuple) ekle. target_entitiesiçindeki herhangi bir demet için, eğer varlık etiketi (demetin ikinci özniteliği)PRODUCTisecorrect_labelslistesineTrueekle; değilseFalseekle.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Append a tuple of (entities text, entities label) if Jumbo is in the entity
target_entities = []
for doc in ____:
target_entities.extend([(ent.____, ent.____) for ent in doc.____ if "Jumbo" in ent.text])
print(target_entities)
# Append True to the correct_labels list if the entity label is `PRODUCT`
correct_labels = []
for ent in target_entities:
if ____[1] == "PRODUCT":
correct_labels.append(____)
else:
correct_labels.append(____)
print(correct_labels)