Pérdida de información en la factorización

Puede que te preguntes cómo los factores con muchas menos columnas pueden resumir un DataFrame más grande sin pérdida. En realidad, no es así: los factores que creamos suelen ser una aproximación cercana de los datos, ya que es inevitable que se pierda cierta información. Esto significa que los valores predichos quizá no sean exactos, pero deberían ser lo bastante cercanos como para resultar útiles.

En este ejercicio, revisarás el mismo DataFrame original previo a la factorización del ejercicio anterior cargado como original_df, y lo compararás con el producto de sus dos factores, user_matrix e item_matrix.

Este ejercicio forma parte del curso

Creación de motores de recomendación en Python

Ver curso

Instrucciones del ejercicio

Calcula el producto punto de user_matrix e item_matrix y guárdalo como predictions_df.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

import numpy as np

# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)

# Inspect the original DataFrame and compare
print(original_df)

Editar y ejecutar código