Ziffern, Wörter und Leerzeichen
Bisher hast du in deinem Leben vielleicht immer genau nach einer bestimmten Zahl oder einem bestimmten Wort gesucht. Jetzt hast du ein viel flexibleres Werkzeug zur Hand, um zu suchen nach:
\\dZiffern (null bis neun)\\wWortzeichen (Buchstaben, Ziffern oder Unterstriche)\\sLeerraum (auch Tabs und Zeilenumbrüche)
Außerdem kannst du eckige Klammern [A-Za-z] verwenden und darin eine Liste möglicher Werte angeben.
Du hast bereits alle Fortsetzungen von "Saw" gefunden. Kannst du ein Muster erstellen, das alle Fortsetzungen in der Liste movie_titles findet? Die haben normalerweise eine Zahl am Ende, oder?
Außerdem enthält die Liste Dubletten durch "Grey" (britisch) und "Gray" (amerikanisches Englisch). Erstelle ein Muster, das beide Schreibweisen der Farbe trifft.
Zum Schluss: Liste alle Filmtitel auf, die besondere, nicht-Wortzeichen enthalten.
Diese Übung ist Teil des Kurses
Fortgeschrittene Reguläre Ausdrücke in R
Anleitung zur Übung
- Finde alle Filmtitel, die mit einem Leerzeichen gefolgt von einer Ziffer enden.
- Triff sowohl
"Grey"als auch"Gray"mit einem benutzerdefinierten Muster[…]. - Schreibe ein Muster, das alles außer Wortzeichen
\\wund Leerraum\\sfindet.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# List all movies that end with a space and a digit
movie_titles[str_detect(movie_titles,
pattern = "___"
)]
# List all movies that contain "Grey" or "Gray"
movie_titles[str_detect(movie_titles,
pattern = "Gr___y"
)]
# List all movies with strange characters (no word or space)
movie_titles[str_detect(movie_titles,
pattern = "[___]"
)]