ComenzarEmpieza gratis

Normaliza tus datos

Antes de que puedas encontrar los factores de la matriz de puntuaciones usando la descomposición en valores singulares, necesitas "quitar la media" o centrarla, restando la media de cada fila a cada valor de esa fila.

En este ejercicio, empezarás a preparar el DataFrame de puntuaciones de películas con el que has estado trabajando para poder realizar la descomposición en valores singulares.

user_ratings_df contiene una fila por usuario y una columna por película y ya está cargado para ti.

Este ejercicio forma parte del curso

Creación de motores de recomendación en Python

Ver curso

Instrucciones del ejercicio

  • Calcula la puntuación media que cada usuario ha dado en todas las películas que ha visto y guarda estos valores como avg_ratings.
  • Resta las medias de cada fila a sus filas respectivas y guarda el resultado como user_ratings_centered.
  • Por último, rellena con ceros todos los valores ausentes en user_ratings_centered.
  • Imprime la media de cada columna en user_ratings_centered para mostrar que ya están centradas (de-meaned).

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Get the average rating for each user 
avg_ratings = user_ratings_df.____(axis=1)

# Center each user's ratings around 0
user_ratings_centered = user_ratings_df.____(____, axis=1)

# Fill in all missing values with 0s
user_ratings_centered.____(0, inplace=True)

# Print the mean of each column
print(user_ratings_centered.____(axis=1))
Editar y ejecutar código