Een geavanceerde reguliere expressie extraheren
In deze oefening bouw je voort op de vorige oefeningen door een meer geavanceerde reguliere expressie te maken die de filmtitel, de bedrijfsnaam van de distributeur en het aantal zalen per regel in de data frame screens_per_movie vastlegt.
Elke regel van screens_per_movie bevat deze drie onderdelen. Met extract haal je deze drie eruit en krijg je drie nieuwe kolommen met precies de informatie die je wilt, in een tabelvorm en gestructureerd. Deze stap is cruciaal als je ongestructureerde data wilt begrijpen en omzetten naar een vorm die je later kunt analyseren en visualiseren.
Deze oefening maakt deel uit van de cursus
Gevorderde reguliere expressies in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the first three lines of screens_per_movie
___[1:3, ]