Alle filmparen vinden
In deze oefening ga je na hoe je alle paren van films, of alle permutaties van filmparen, vindt die door dezelfde persoon zijn bekeken.
De user_ratings_df is opnieuw geladen en bevat gebruikers en de films die ze hebben gezien.
Je maakt eerst een functie die alle mogelijke paren van items vindt in een lijst waarop hij wordt toegepast.
Voor het gemak geef je de uitkomst terug als een DataFrame.
Omdat je alleen films wilt vinden die door dezelfde persoon zijn bekeken en niet alle mogelijke permutaties, groepeer je op user_id wanneer je de functie toepast.
Deze oefening maakt deel uit van de cursus
Aanbevelingssystemen bouwen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
from itertools import permutations
# Create the function to find all permutations
def ____(x):
pairs = pd.____(list(____(x.values, 2)),
columns=['movie_a', 'movie_b'])
return pairs
# Apply the function to the title column and reset the index
movie_combinations = user_ratings_df.____('userId')['title'].____(find_movie_pairs)
print(movie_combinations)