Faire des recommandations avec le TF-IDF
Dans le dernier exercice, vous avez pré-calculé les scores de similarité entre tous les films du jeu de données à partir de leurs résumés transformés par TF-IDF. Vous allez maintenant placer ces scores de similarité dans un DataFrame pour en faciliter l’utilisation, puis utiliser ce nouveau DataFrame pour suggérer un film.
Le cosine_similarity_array contenant la matrice des valeurs de similarité entre tous les films, que vous avez créée à l’exercice précédent, a été chargé pour vous. Le DataFrame tfidf_summary_df, qui contient les films et leurs caractéristiques TF-IDF, est également disponible.
Cet exercice fait partie du cours
Créer des moteurs de recommandation en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Wrap the preloaded array in a DataFrame
cosine_similarity_df = pd.____(____, index=tfidf_summary_df.index, columns=tfidf_summary_df.index)
# Find the values for the movie Rio
cosine_similarity_series = ____.____['Rio']
# Sort these values highest to lowest
ordered_similarities = cosine_similarity_series.____(____)
# Print the results
print(____)