Mengompensasi data yang tidak lengkap
Pada sebagian besar himpunan data, mayoritas pengguna hanya menilai sejumlah kecil item. Seperti yang Anda lihat pada latihan sebelumnya, cara Anda menangani pengguna yang tidak memiliki penilaian untuk suatu item dapat sangat memengaruhi keabsahan model Anda.
Dalam latihan ini, Anda akan mengisi data yang hilang dengan informasi yang tidak akan membiasakan data yang sudah Anda miliki.
Anda akan mengambil skor rata-rata yang diberikan setiap pengguna di seluruh penilaiannya, lalu menggunakan rata-rata ini untuk memusatkan skor pengguna di sekitar nol. Terakhir, Anda dapat mengisi nilai kosong dengan nol, yang kini menjadi skor netral, meminimalkan dampak pada profil keseluruhan mereka, tetapi tetap memungkinkan perbandingan antar pengguna.
user_ratings_table dengan satu baris per pengguna telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Membangun Recommendation Engine di Python
Petunjuk latihan
- Temukan rata-rata penilaian yang diberikan oleh setiap pengguna di
user_ratings_tabledan simpan sebagaiavg_ratings. - Kurangkan rata-rata baris dari setiap baris di
user_ratings_table, lalu simpan sebagaiuser_ratings_table_centered. - Isi nilai kosong dalam
user_ratings_table_centeredyang baru dibuat dengan nol.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the average rating for each user
avg_ratings = user_ratings_table.____(axis=____)
# Center each users ratings around 0
user_ratings_table_centered = user_ratings_table.____(____, axis=0)
# Fill in the missing data with 0s
user_ratings_table_normed = user_ratings_table_centered.____(____)