Eksik veriyi telafi etme
Çoğu veri kümesinde, kullanıcıların büyük kısmı yalnızca az sayıda öğeyi puanlamıştır. Son egzersizde gördüğün gibi, bir öğe için puanı olmayan kullanıcılarla nasıl başa çıktığın, modellerinin geçerliliğini büyük ölçüde etkileyebilir.
Bu egzersizde, elindeki veriyi önyargıya uğratmaması gereken bilgilerle eksik verileri dolduracaksın.
Önce her kullanıcının tüm puanları üzerinden verdiği ortalama puanı alacak, ardından bu ortalamayı kullanarak kullanıcıların puanlarını sıfır etrafında merkezleyeceksin. Son olarak, artık nötr bir değer olan sıfırla boş değerleri doldurabileceksin; bu hem genel profilleri üzerindeki etkiyi en aza indirir hem de kullanıcıların karşılaştırılmasına olanak tanır.
Her kullanıcı için bir satır içeren user_ratings_table senin için yüklendi.
Bu egzersiz
Python ile Öneri Motorları Geliştirme
kursunun bir parçasıdırEgzersiz talimatları
user_ratings_tableiçindeki her kullanıcının verdiği puanların ortalamasını bul veavg_ratingsolarak sakla.- Satır ortalamalarını
user_ratings_tableiçindeki her satırdan çıkar ve sonucuuser_ratings_table_centeredolarak sakla. - Yeni oluşturduğun
user_ratings_table_centerediçindeki boş değerleri sıfırlarla doldur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Get the average rating for each user
avg_ratings = user_ratings_table.____(axis=____)
# Center each users ratings around 0
user_ratings_table_centered = user_ratings_table.____(____, axis=0)
# Fill in the missing data with 0s
user_ratings_table_normed = user_ratings_table_centered.____(____)