Aan de slagGa gratis aan de slag

Een regex maken die past bij jouw behoeften

In deze oefening ga je herhalen wat je net in de video-oefening zag door de letters "3D" te extraheren uit de kolom "line" van de data frame screens_per_movie.

Voor de functie extract() correct werkt, moet je aan de volgende voorwaarde voldoen: Het aantal capturing groups in de reguliere expressie regex moet identiek zijn aan de lengte van de vector into. Als dat niet zo is, krijg je een foutmelding.

Kun je dit oplossen zodat "3D" en een of meer cijfers \\d+ correct worden geëxtraheerd uit de data frame screens_per_movie?

Deze oefening maakt deel uit van de cursus

Gevorderde reguliere expressies in R

Cursus bekijken

Oefeninstructies

  • Maak een reguliere expressie regex met twee capturing groups (). Hun inhoud wordt geëxtraheerd naar de nieuwe kolommen.
  • Zorg dat je de oorspronkelijke tekstkolom niet verwijdert.
  • Zorg dat de tweede gecaptureerde groep wordt geconverteerd naar getallen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

extract(
  screens_per_movie,
  line,
  into = c("is_3d", "screens"),
  # Capture two groups: "3D" and "one or more digits"
  regex = "___.*?___$",
  # Pass TRUE or FALSE, the original column should not be removed
  remove = ___,
  # Pass TRUE or FALSE, the result should get converted to numbers
  convert = ___
)
Code bewerken en uitvoeren