Normalisasi data Anda
Sebelum Anda dapat menemukan faktor-faktor matriks rating menggunakan singular value decomposition, Anda perlu melakukan "de-mean", atau melakukan pemusatan, dengan mengurangkan rata-rata tiap baris dari setiap nilai dalam baris tersebut.
Dalam latihan ini, Anda akan mulai menyiapkan DataFrame rating film yang telah Anda gunakan agar dapat melakukan Singular value decomposition.
user_ratings_df memuat satu baris per pengguna dan satu kolom untuk setiap film, dan telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Membangun Recommendation Engine di Python
Petunjuk latihan
- Cari rata-rata rating yang diberikan setiap pengguna untuk semua film yang mereka tonton dan simpan nilai-nilai ini sebagai
avg_ratings. - Kurangkan rata-rata baris dari baris masing-masing dan simpan hasilnya sebagai
user_ratings_centered. - Terakhir, isi semua nilai yang hilang dalam
user_ratings_centereddengan nol. - Cetak rata-rata setiap kolom dalam
user_ratings_centereduntuk menunjukkan bahwa data telah di-de-mean.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the average rating for each user
avg_ratings = user_ratings_df.____(axis=1)
# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)
# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)
# Print the mean of each column
print(user_ratings_centered.____(axis=1))