BaşlayınÜcretsiz başlayın

Eksik veriyi telafi etme

Çoğu veri kümesinde, kullanıcıların büyük kısmı yalnızca az sayıda öğeyi puanlamıştır. Son egzersizde gördüğün gibi, bir öğe için puanı olmayan kullanıcılarla nasıl başa çıktığın, modellerinin geçerliliğini büyük ölçüde etkileyebilir.

Bu egzersizde, elindeki veriyi önyargıya uğratmaması gereken bilgilerle eksik verileri dolduracaksın.

Önce her kullanıcının tüm puanları üzerinden verdiği ortalama puanı alacak, ardından bu ortalamayı kullanarak kullanıcıların puanlarını sıfır etrafında merkezleyeceksin. Son olarak, artık nötr bir değer olan sıfırla boş değerleri doldurabileceksin; bu hem genel profilleri üzerindeki etkiyi en aza indirir hem de kullanıcıların karşılaştırılmasına olanak tanır.

Her kullanıcı için bir satır içeren user_ratings_table senin için yüklendi.

Bu egzersiz, kursun bir parçasıdır

Python ile Öneri Motorları Geliştirme

Kursa Göz Atın

Egzersiz talimatları

  • user_ratings_table içindeki her kullanıcının verdiği puanların ortalamasını bul ve avg_ratings olarak sakla.
  • Satır ortalamalarını user_ratings_table içindeki her satırdan çıkar ve sonucu user_ratings_table_centered olarak sakla.
  • Yeni oluşturduğun user_ratings_table_centered içindeki boş değerleri sıfırlarla doldur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Get the average rating for each user 
avg_ratings = user_ratings_table.____(axis=____)

# Center each users ratings around 0
user_ratings_table_centered = user_ratings_table.____(____, axis=0)

# Fill in the missing data with 0s
user_ratings_table_normed = user_ratings_table_centered.____(____)
Kodu Düzenle ve Çalıştır