Aan de slagGa gratis aan de slag

Populaire genres met right join

Wat zijn de genres van de populairste films? Om die vraag te beantwoorden, moet je gegevens uit de tabellen movies en movie_to_genres samenvoegen. In een tabel pop_movies zijn de top 10 populairste films uit de tabel movies geselecteerd. Om zeker te weten dat je alle populaire films analyseert, merge je deze met de tabel movie_to_genres met een right join. Rond je analyse af door het aantal verschillende genres te tellen. De twee tabellen kun je mergen op het film-ID. In pop_movies heet die kolom echter id, en in movie_to_genres heet hij movie_id.

De tabellen pop_movies en movie_to_genres zijn alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Data samenvoegen met pandas

Cursus bekijken

Oefeninstructies

  • Merge movie_to_genres en pop_movies met een right join. Sla het resultaat op als genres_movies.
  • Groepeer genres_movies op genre en tel het aantal id-waarden.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Use right join to merge the movie_to_genres and pop_movies tables
genres_movies = ____.merge(____, how='____', 
                                      ____, 
                                      ____)

# Count the number of genres
genre_count = genres_movies.groupby('____').agg({'id':'count'})

# Plot a bar chart of the genre_count
genre_count.plot(kind='bar')
plt.show()
Code bewerken en uitvoeren