Perda de informação na fatoração
Você pode se perguntar como fatores com bem menos colunas conseguem resumir um DataFrame maior sem perda. Na verdade, não conseguem — os fatores que criamos são geralmente uma aproximação do conjunto de dados, já que é inevitável perder um pouco de informação. Isso significa que os valores previstos podem não ser exatos, mas devem ficar próximos o suficiente para serem úteis.
Neste exercício, você vai inspecionar o mesmo DataFrame original antes da fatoração, carregado como original_df, e compará-lo ao produto de seus dois fatores, user_matrix e item_matrix.
Este exercício faz parte do curso
Construindo mecanismos de recomendação em Python
Instruções do exercício
- Encontre o produto escalar (dot product) de
user_matrixeitem_matrixe armazene o resultado empredictions_df.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
import numpy as np
# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)
# Inspect the original DataFrame and compare
print(original_df)