MulaiMulai sekarang secara gratis

Mengompensasi data yang tidak lengkap

Pada sebagian besar himpunan data, mayoritas pengguna hanya menilai sejumlah kecil item. Seperti yang Anda lihat pada latihan sebelumnya, cara Anda menangani pengguna yang tidak memiliki penilaian untuk suatu item dapat sangat memengaruhi keabsahan model Anda.

Dalam latihan ini, Anda akan mengisi data yang hilang dengan informasi yang tidak akan membiasakan data yang sudah Anda miliki.

Anda akan mengambil skor rata-rata yang diberikan setiap pengguna di seluruh penilaiannya, lalu menggunakan rata-rata ini untuk memusatkan skor pengguna di sekitar nol. Terakhir, Anda dapat mengisi nilai kosong dengan nol, yang kini menjadi skor netral, meminimalkan dampak pada profil keseluruhan mereka, tetapi tetap memungkinkan perbandingan antar pengguna.

user_ratings_table dengan satu baris per pengguna telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Membangun Recommendation Engine di Python

Lihat Kursus

Petunjuk latihan

  • Temukan rata-rata penilaian yang diberikan oleh setiap pengguna di user_ratings_table dan simpan sebagai avg_ratings.
  • Kurangkan rata-rata baris dari setiap baris di user_ratings_table, lalu simpan sebagai user_ratings_table_centered.
  • Isi nilai kosong dalam user_ratings_table_centered yang baru dibuat dengan nol.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Get the average rating for each user 
avg_ratings = user_ratings_table.____(axis=____)

# Center each users ratings around 0
user_ratings_table_centered = user_ratings_table.____(____, axis=0)

# Fill in the missing data with 0s
user_ratings_table_normed = user_ratings_table_centered.____(____)
Edit dan Jalankan Kode