Populaire genres met right join
Wat zijn de genres van de populairste films? Om die vraag te beantwoorden, moet je gegevens uit de tabellen movies en movie_to_genres samenvoegen. In een tabel pop_movies zijn de top 10 populairste films uit de tabel movies geselecteerd. Om zeker te weten dat je alle populaire films analyseert, merge je deze met de tabel movie_to_genres met een right join. Rond je analyse af door het aantal verschillende genres te tellen. De twee tabellen kun je mergen op het film-ID. In pop_movies heet die kolom echter id, en in movie_to_genres heet hij movie_id.
De tabellen pop_movies en movie_to_genres zijn alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Data samenvoegen met pandas
Oefeninstructies
- Merge
movie_to_genresenpop_moviesmet een right join. Sla het resultaat op alsgenres_movies. - Groepeer
genres_moviesopgenreen tel het aantalid-waarden.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Use right join to merge the movie_to_genres and pop_movies tables
genres_movies = ____.merge(____, how='____',
____,
____)
# Count the number of genres
genre_count = genres_movies.groupby('____').agg({'id':'count'})
# Plot a bar chart of the genre_count
genre_count.plot(kind='bar')
plt.show()