Perda de informação na fatoração

Você pode se perguntar como fatores com bem menos colunas conseguem resumir um DataFrame maior sem perda. Na verdade, não conseguem — os fatores que criamos são geralmente uma aproximação do conjunto de dados, já que é inevitável perder um pouco de informação. Isso significa que os valores previstos podem não ser exatos, mas devem ficar próximos o suficiente para serem úteis.

Neste exercício, você vai inspecionar o mesmo DataFrame original antes da fatoração, carregado como original_df, e compará-lo ao produto de seus dois fatores, user_matrix e item_matrix.

Este exercicio faz parte do curso

Construindo mecanismos de recomendação em Python

Ver curso

Instruções do exercicio

Encontre o produto escalar (dot product) de user_matrix e item_matrix e armazene o resultado em predictions_df.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

import numpy as np

# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)

# Inspect the original DataFrame and compare
print(original_df)

Editar e Executar Código