Perdita di informazione nella fattorizzazione

Potresti chiederti come i fattori con molte meno colonne possano riassumere un DataFrame più grande senza perdita. In realtà, non è così: i fattori che creiamo sono generalmente una stretta approssimazione dei dati, ed è inevitabile perdere un po' di informazione. Questo significa che i valori previsti potrebbero non essere esatti, ma dovrebbero essere abbastanza vicini da risultare utili.

In questo esercizio esaminerai lo stesso DataFrame originale pre-fattorizzazione dell'esercizio precedente, caricato come original_df, e lo confronterai con il prodotto dei suoi due fattori, user_matrix e item_matrix.

Questo esercizio fa parte del corso

Creare motori di raccomandazione in Python

Visualizza corso

Istruzioni dell'esercizio

Trova il prodotto scalare (dot product) tra user_matrix e item_matrix e salvalo come predictions_df.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

import numpy as np

# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)

# Inspect the original DataFrame and compare
print(original_df)

Modifica ed esegui il codice