En de Oscar voor beste regisseur gaat naar ... <NA>
Je werkt met een steekproef van de Netflix-gegevensset die is vooringeladen als director_df. Deze data frame bevat dit keer alleen de regisseurs en filmtitels. Je doel is om de regisseurs te vinden die de meeste films hebben gemaakt. Omdat de kolom director meerdere namen bevat, spreid je de waarden eerst over meerdere rijen en tel je daarna de regisseurs.
Omdat je geen films zonder regisseur in je overzicht wilt, gebruik je de functie drop_na().
Het pakket dplyr is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Data herstructureren met tidyr
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
director_df %>%
# Spread the director column over separate rows
___