Perte d’information lors de la factorisation
Vous pouvez vous demander comment des facteurs avec bien moins de colonnes peuvent résumer un DataFrame plus grand sans perte. En réalité, ce n’est pas le cas : les facteurs que nous créons sont généralement une approximation du jeu de données, et il est inévitable de perdre une partie de l’information. Cela signifie que les valeurs prédites ne seront pas exactes, mais devraient être suffisamment proches pour être utiles.
Dans cet exercice, vous allez examiner le même DataFrame d’origine, avant factorisation, chargé sous le nom original_df, et le comparer au produit de ses deux facteurs, user_matrix et item_matrix.
Cet exercice fait partie du cours
Créer des moteurs de recommandation en Python
Instructions
- Calculez le produit matriciel de
user_matrixetitem_matrixet enregistrez-le danspredictions_df.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import numpy as np
# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)
# Inspect the original DataFrame and compare
print(original_df)