BaşlayınÜcretsiz Başlayın

Verilerinde model performansı

Bu egzersizde, mevcut bir modeli kendi verilerin üzerinde değerlendirmeyi pratik edeceksin. Bu durumda amaç, belirli bir varlık etiketi olan PRODUCT üzerinde model performansını incelemek. Bir model, PRODUCT varlıklarının büyük bir yüzdesini (ör. %75’ten fazla) doğru sınıflandırabiliyorsa, modeli PRODUCT varlık örnekleriyle eğitmen gerekmez; aksi halde, PRODUCT varlığı tahminindeki performansını artırmak için modeli eğitmeyi düşünmelisin.

Bu egzersiz için Amazon Fine Food Reviews veri kümesinden iki yorumu kullanacaksın. Bu yorumlara texts listesiyle erişebilirsin.

en_core_web_sm modeli senin için zaten yüklendi. nlp() çağırarak erişebilirsin. Model texts listesi üzerinde zaten çalıştırıldı ve kullanımın için Doc kapsayıcılarından oluşan documents listesi hazır.

Bu egzersiz

spaCy ile Natural Language Processing

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Her bir documents öğesi için tüm varlıkları içeren bir target_entities listesi derle ve yalnızca varlık metni içinde Jumbo geçiyorsa (varlık metni, varlık etiketi) şeklinde bir demeti (tuple) ekle.
  • target_entities içindeki herhangi bir demet için, eğer varlık etiketi (demetin ikinci özniteliği) PRODUCT ise correct_labels listesine True ekle; değilse False ekle.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Append a tuple of (entities text, entities label) if Jumbo is in the entity
target_entities = []
for doc in ____:
  target_entities.extend([(ent.____, ent.____) for ent in doc.____ if "Jumbo" in ent.text])
print(target_entities)

# Append True to the correct_labels list if the entity label is `PRODUCT`
correct_labels = []
for ent in target_entities:
  if ____[1] == "PRODUCT":
    correct_labels.append(____)
  else:
    correct_labels.append(____)
print(correct_labels)
Kodu Düzenle ve Çalıştır