Aan de slagGa gratis aan de slag

Aanbevelingen maken met TF-IDF

In de vorige oefening heb je de vergelijkbaarheidscores tussen alle films in de gegevensset vooraf berekend op basis van hun plots, getransformeerd met TF-IDF. Nu zet je deze vergelijkbaarheidscores in een DataFrame voor gebruiksgemak. Daarna gebruik je dit nieuwe DataFrame om een filmaanbeveling te doen.

De cosine_similarity_array met een matrix van de gelijkeniswaarden tussen alle films die je in de vorige oefening hebt gemaakt, is voor je geladen. Het DataFrame tfidf_summary_df met de films en hun TF-IDF-kenmerken is ook beschikbaar.

Deze oefening maakt deel uit van de cursus

Aanbevelingssystemen bouwen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Wrap the preloaded array in a DataFrame
cosine_similarity_df = pd.____(____, index=tfidf_summary_df.index, columns=tfidf_summary_df.index)

# Find the values for the movie Rio
cosine_similarity_series = ____.____['Rio']

# Sort these values highest to lowest
ordered_similarities = cosine_similarity_series.____(____)

# Print the results
print(____)
Code bewerken en uitvoeren