IniziaInizia gratis

Normalizza i tuoi dati

Prima di poter trovare i fattori della matrice delle valutazioni usando la decomposizione ai valori singolari, devi "rimuovere la media" (centrare) sottraendo la media di ciascuna riga da ogni valore in quella riga.

In questo esercizio, inizierai a preparare il DataFrame delle valutazioni dei film con cui hai lavorato, così da poter eseguire la decomposizione ai valori singolari.

user_ratings_df contiene una riga per ogni utente e una colonna per ogni film, ed è già stato caricato per te.

Questo esercizio fa parte del corso

Creare motori di raccomandazione in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Trova la valutazione media che ogni utente ha dato su tutti i film che ha visto e salva questi valori come avg_ratings.
  • Sottrai le medie di riga dalle rispettive righe e salva il risultato come user_ratings_centered.
  • Infine, riempi tutti i valori mancanti in user_ratings_centered con zeri.
  • Stampa la media di ciascuna colonna in user_ratings_centered per mostrare che sono state centrate (de-meaned).

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Get the average rating for each user 
avg_ratings = user_ratings_df.____(axis=1)

# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)

# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)

# Print the mean of each column
print(user_ratings_centered.____(axis=1))
Modifica ed esegui il codice