ComeçarComece de graça

Perda de informação na fatoração

Você pode se perguntar como fatores com bem menos colunas conseguem resumir um DataFrame maior sem perda. Na verdade, não conseguem — os fatores que criamos são geralmente uma aproximação do conjunto de dados, já que é inevitável perder um pouco de informação. Isso significa que os valores previstos podem não ser exatos, mas devem ficar próximos o suficiente para serem úteis.

Neste exercício, você vai inspecionar o mesmo DataFrame original antes da fatoração, carregado como original_df, e compará-lo ao produto de seus dois fatores, user_matrix e item_matrix.

Este exercício faz parte do curso

Construindo mecanismos de recomendação em Python

Ver curso

Instruções do exercício

  • Encontre o produto escalar (dot product) de user_matrix e item_matrix e armazene o resultado em predictions_df.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

import numpy as np

# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)

# Inspect the original DataFrame and compare
print(original_df)
Editar e executar o código