CommencerCommencer gratuitement

Perte d’information lors de la factorisation

Vous pouvez vous demander comment des facteurs avec bien moins de colonnes peuvent résumer un DataFrame plus grand sans perte. En réalité, ce n’est pas le cas : les facteurs que nous créons sont généralement une approximation du jeu de données, et il est inévitable de perdre une partie de l’information. Cela signifie que les valeurs prédites ne seront pas exactes, mais devraient être suffisamment proches pour être utiles.

Dans cet exercice, vous allez examiner le même DataFrame d’origine, avant factorisation, chargé sous le nom original_df, et le comparer au produit de ses deux facteurs, user_matrix et item_matrix.

Cet exercice fait partie du cours

Créer des moteurs de recommandation en Python

Afficher le cours

Instructions

  • Calculez le produit matriciel de user_matrix et item_matrix et enregistrez-le dans predictions_df.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

import numpy as np

# Multiply the user and item matrices
predictions_df = ____.____(____, ____)
# Inspect the recreated DataFrame
print(predictions_df)

# Inspect the original DataFrame and compare
print(original_df)
Modifier et exécuter le code