Normalizza i tuoi dati
Prima di poter trovare i fattori della matrice delle valutazioni usando la decomposizione ai valori singolari, devi "rimuovere la media" (centrare) sottraendo la media di ciascuna riga da ogni valore in quella riga.
In questo esercizio, inizierai a preparare il DataFrame delle valutazioni dei film con cui hai lavorato, così da poter eseguire la decomposizione ai valori singolari.
user_ratings_df contiene una riga per ogni utente e una colonna per ogni film, ed è già stato caricato per te.
Questo esercizio fa parte del corso
Creare motori di raccomandazione in Python
Istruzioni dell'esercizio
- Trova la valutazione media che ogni utente ha dato su tutti i film che ha visto e salva questi valori come
avg_ratings. - Sottrai le medie di riga dalle rispettive righe e salva il risultato come
user_ratings_centered. - Infine, riempi tutti i valori mancanti in
user_ratings_centeredcon zeri. - Stampa la media di ciascuna colonna in
user_ratings_centeredper mostrare che sono state centrate (de-meaned).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Get the average rating for each user
avg_ratings = user_ratings_df.____(axis=1)
# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)
# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)
# Print the mean of each column
print(user_ratings_centered.____(axis=1))