Aanbevelingen maken met TF-IDF
In de vorige oefening heb je de vergelijkbaarheidscores tussen alle films in de gegevensset vooraf berekend op basis van hun plots, getransformeerd met TF-IDF. Nu zet je deze vergelijkbaarheidscores in een DataFrame voor gebruiksgemak. Daarna gebruik je dit nieuwe DataFrame om een filmaanbeveling te doen.
De cosine_similarity_array met een matrix van de gelijkeniswaarden tussen alle films die je in de vorige oefening hebt gemaakt, is voor je geladen. Het DataFrame tfidf_summary_df met de films en hun TF-IDF-kenmerken is ook beschikbaar.
Deze oefening maakt deel uit van de cursus
Aanbevelingssystemen bouwen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Wrap the preloaded array in a DataFrame
cosine_similarity_df = pd.____(____, index=tfidf_summary_df.index, columns=tfidf_summary_df.index)
# Find the values for the movie Rio
cosine_similarity_series = ____.____['Rio']
# Sort these values highest to lowest
ordered_similarities = cosine_similarity_series.____(____)
# Print the results
print(____)