Cijfers, woorden en spaties
Tot nu toe zocht je in je leven misschien altijd naar precies één getal of woord. Nu heb je een veel flexibeler hulpmiddel om te zoeken naar:
\\dcijfers (nul tot en met negen)\\wwoordtekens (letters, cijfers of underscores)\\switruimtes (ook tabs en regeleinden)
Daarnaast kun je vierkante haken gebruiken [A-Za-z] en een lijst met mogelijke waarden binnenin opnemen.
Je hebt al alle vervolgdelen van "Saw" gevonden. Kun je een patroon maken dat alle vervolgdelen in de lijst movie_titles vindt? Die hebben meestal een getal aan het einde, toch?
Verder bevat de lijst duplicaten door "Grey" (Brits) en "Gray" (Amerikaans Engels). Maak een patroon dat beide schrijfwijzen van de kleur matcht.
Maak tot slot een lijst van alle filmtitels die speciale, niet-woordtekens bevatten.
Deze oefening maakt deel uit van de cursus
Gevorderde reguliere expressies in R
Oefeninstructies
- Match alle filmtitels die eindigen met een spatie gevolgd door een cijfer.
- Match zowel
"Grey"als"Gray"met een eigen patroon[…]. - Schrijf een patroon dat alles behalve woordtekens
\\wen spaties\\smatcht.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# List all movies that end with a space and a digit
movie_titles[str_detect(movie_titles,
pattern = "___"
)]
# List all movies that contain "Grey" or "Gray"
movie_titles[str_detect(movie_titles,
pattern = "Gr___y"
)]
# List all movies with strange characters (no word or space)
movie_titles[str_detect(movie_titles,
pattern = "[___]"
)]