Perdita di informazione nella fattorizzazione
Potresti chiederti come i fattori con molte meno colonne possano riassumere un DataFrame più grande senza perdita. In realtà, non è così: i fattori che creiamo sono generalmente una stretta approssimazione dei dati, ed è inevitabile perdere un po' di informazione. Questo significa che i valori previsti potrebbero non essere esatti, ma dovrebbero essere abbastanza vicini da risultare utili.
In questo esercizio esaminerai lo stesso DataFrame originale pre-fattorizzazione dell'esercizio precedente, caricato come original_df, e lo confronterai con il prodotto dei suoi due fattori, user_matrix e item_matrix.
Questo esercizio fa parte del corso
Creare motori di raccomandazione in Python
Istruzioni dell'esercizio
- Trova il prodotto scalare (dot product) tra
user_matrixeitem_matrixe salvalo comepredictions_df.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
import numpy as np
# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)
# Inspect the original DataFrame and compare
print(original_df)