Pérdida de información en la factorización
Puede que te preguntes cómo los factores con muchas menos columnas pueden resumir un DataFrame más grande sin pérdida. En realidad, no es así: los factores que creamos suelen ser una aproximación cercana de los datos, ya que es inevitable que se pierda cierta información. Esto significa que los valores predichos quizá no sean exactos, pero deberían ser lo bastante cercanos como para resultar útiles.
En este ejercicio, revisarás el mismo DataFrame original previo a la factorización del ejercicio anterior cargado como original_df, y lo compararás con el producto de sus dos factores, user_matrix e item_matrix.
Este ejercicio forma parte del curso
Creación de motores de recomendación en Python
Instrucciones del ejercicio
- Calcula el producto punto de
user_matrixeitem_matrixy guárdalo comopredictions_df.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
import numpy as np
# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)
# Inspect the original DataFrame and compare
print(original_df)