Normaliza tus datos
Antes de que puedas encontrar los factores de la matriz de puntuaciones usando la descomposición en valores singulares, necesitas "quitar la media" o centrarla, restando la media de cada fila a cada valor de esa fila.
En este ejercicio, empezarás a preparar el DataFrame de puntuaciones de películas con el que has estado trabajando para poder realizar la descomposición en valores singulares.
user_ratings_df contiene una fila por usuario y una columna por película y ya está cargado para ti.
Este ejercicio forma parte del curso
Creación de motores de recomendación en Python
Instrucciones del ejercicio
- Calcula la puntuación media que cada usuario ha dado en todas las películas que ha visto y guarda estos valores como
avg_ratings. - Resta las medias de cada fila a sus filas respectivas y guarda el resultado como
user_ratings_centered. - Por último, rellena con ceros todos los valores ausentes en
user_ratings_centered. - Imprime la media de cada columna en
user_ratings_centeredpara mostrar que ya están centradas (de-meaned).
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Get the average rating for each user
avg_ratings = user_ratings_df.____(axis=1)
# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)
# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)
# Print the mean of each column
print(user_ratings_centered.____(axis=1))