Verilerinde model performansı
Bu egzersizde, mevcut bir modeli kendi verilerin üzerinde değerlendirmeyi pratik edeceksin. Bu durumda amaç, belirli bir varlık etiketi olan PRODUCT üzerinde model performansını incelemek. Bir model, PRODUCT varlıklarının büyük bir yüzdesini (ör. %75’ten fazla) doğru sınıflandırabiliyorsa, modeli PRODUCT varlık örnekleriyle eğitmen gerekmez; aksi halde, PRODUCT varlığı tahminindeki performansını artırmak için modeli eğitmeyi düşünmelisin.
Bu egzersiz için Amazon Fine Food Reviews veri kümesinden iki yorumu kullanacaksın. Bu yorumlara texts listesiyle erişebilirsin.
en_core_web_sm modeli senin için zaten yüklendi. nlp() çağırarak erişebilirsin. Model texts listesi üzerinde zaten çalıştırıldı ve kullanımın için Doc kapsayıcılarından oluşan documents listesi hazır.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
- Her bir
documentsöğesi için tüm varlıkları içeren birtarget_entitieslistesi derle ve yalnızca varlık metni içindeJumbogeçiyorsa (varlık metni, varlık etiketi) şeklinde bir demeti (tuple) ekle. target_entitiesiçindeki herhangi bir demet için, eğer varlık etiketi (demetin ikinci özniteliği)PRODUCTisecorrect_labelslistesineTrueekle; değilseFalseekle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Append a tuple of (entities text, entities label) if Jumbo is in the entity
target_entities = []
for doc in ____:
target_entities.extend([(ent.____, ent.____) for ent in doc.____ if "Jumbo" in ent.text])
print(target_entities)
# Append True to the correct_labels list if the entity label is `PRODUCT`
correct_labels = []
for ent in target_entities:
if ____[1] == "PRODUCT":
correct_labels.append(____)
else:
correct_labels.append(____)
print(correct_labels)