Aan de slagBegin gratis

Een geavanceerde reguliere expressie extraheren

In deze oefening bouw je voort op de vorige oefeningen door een meer geavanceerde reguliere expressie te maken die de filmtitel, de bedrijfsnaam van de distributeur en het aantal zalen per regel in de data frame screens_per_movie vastlegt.

Elke regel van screens_per_movie bevat deze drie onderdelen. Met extract haal je deze drie eruit en krijg je drie nieuwe kolommen met precies de informatie die je wilt, in een tabelvorm en gestructureerd. Deze stap is cruciaal als je ongestructureerde data wilt begrijpen en omzetten naar een vorm die je later kunt analyseren en visualiseren.

Deze oefening maakt deel uit van de cursus

Gevorderde reguliere expressies in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Print the first three lines of screens_per_movie
___[1:3, ]
Code bewerken en uitvoeren