Aan de slagGa gratis aan de slag

Cijfers, woorden en spaties

Tot nu toe zocht je in je leven misschien altijd naar precies één getal of woord. Nu heb je een veel flexibeler hulpmiddel om te zoeken naar:

  • \\d cijfers (nul tot en met negen)
  • \\w woordtekens (letters, cijfers of underscores)
  • \\s witruimtes (ook tabs en regeleinden)

Daarnaast kun je vierkante haken gebruiken [A-Za-z] en een lijst met mogelijke waarden binnenin opnemen.

Je hebt al alle vervolgdelen van "Saw" gevonden. Kun je een patroon maken dat alle vervolgdelen in de lijst movie_titles vindt? Die hebben meestal een getal aan het einde, toch?

Verder bevat de lijst duplicaten door "Grey" (Brits) en "Gray" (Amerikaans Engels). Maak een patroon dat beide schrijfwijzen van de kleur matcht.

Maak tot slot een lijst van alle filmtitels die speciale, niet-woordtekens bevatten.

Deze oefening maakt deel uit van de cursus

Gevorderde reguliere expressies in R

Cursus bekijken

Oefeninstructies

  • Match alle filmtitels die eindigen met een spatie gevolgd door een cijfer.
  • Match zowel "Grey" als "Gray" met een eigen patroon […].
  • Schrijf een patroon dat alles behalve woordtekens \\w en spaties \\s matcht.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# List all movies that end with a space and a digit
movie_titles[str_detect(movie_titles,
  pattern = "___"
)]

# List all movies that contain "Grey" or "Gray"
movie_titles[str_detect(movie_titles,
  pattern = "Gr___y"
)]

# List all movies with strange characters (no word or space)
movie_titles[str_detect(movie_titles,
  pattern = "[___]"
)]
Code bewerken en uitvoeren