BaşlayınÜcretsiz Başlayın

Eksik veriyi telafi etme

Çoğu veri kümesinde, kullanıcıların büyük kısmı yalnızca az sayıda öğeyi puanlamıştır. Son egzersizde gördüğün gibi, bir öğe için puanı olmayan kullanıcılarla nasıl başa çıktığın, modellerinin geçerliliğini büyük ölçüde etkileyebilir.

Bu egzersizde, elindeki veriyi önyargıya uğratmaması gereken bilgilerle eksik verileri dolduracaksın.

Önce her kullanıcının tüm puanları üzerinden verdiği ortalama puanı alacak, ardından bu ortalamayı kullanarak kullanıcıların puanlarını sıfır etrafında merkezleyeceksin. Son olarak, artık nötr bir değer olan sıfırla boş değerleri doldurabileceksin; bu hem genel profilleri üzerindeki etkiyi en aza indirir hem de kullanıcıların karşılaştırılmasına olanak tanır.

Her kullanıcı için bir satır içeren user_ratings_table senin için yüklendi.

Bu egzersiz

Python ile Öneri Motorları Geliştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • user_ratings_table içindeki her kullanıcının verdiği puanların ortalamasını bul ve avg_ratings olarak sakla.
  • Satır ortalamalarını user_ratings_table içindeki her satırdan çıkar ve sonucu user_ratings_table_centered olarak sakla.
  • Yeni oluşturduğun user_ratings_table_centered içindeki boş değerleri sıfırlarla doldur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Get the average rating for each user 
avg_ratings = user_ratings_table.____(axis=____)

# Center each users ratings around 0
user_ratings_table_centered = user_ratings_table.____(____, axis=0)

# Fill in the missing data with 0s
user_ratings_table_normed = user_ratings_table_centered.____(____)
Kodu Düzenle ve Çalıştır