Aan de slagGa gratis aan de slag

Een geavanceerde reguliere expressie extraheren

In deze oefening bouw je voort op de vorige oefeningen door een meer geavanceerde reguliere expressie te maken die de filmtitel, de bedrijfsnaam van de distributeur en het aantal zalen per regel in de data frame screens_per_movie vastlegt.

Elke regel van screens_per_movie bevat deze drie onderdelen. Met extract haal je deze drie eruit en krijg je drie nieuwe kolommen met precies de informatie die je wilt, in een tabelvorm en gestructureerd. Deze stap is cruciaal als je ongestructureerde data wilt begrijpen en omzetten naar een vorm die je later kunt analyseren en visualiseren.

Deze oefening maakt deel uit van de cursus

Gevorderde reguliere expressies in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print the first three lines of screens_per_movie
___[1:3, ]
Code bewerken en uitvoeren