Strings bereinigen
In dieser Lektion haben wir die Grundlagen von „Regex“, also regulären Ausdrücken, kennengelernt, mit denen sich allgemeine Muster erfassen lassen. Wir haben zwei Notationen behandelt:
| Expression | Does this |
|---|---|
. |
passt auf jedes Zeichen |
* |
null- oder mehrmals |
Zum Beispiel würde ".*science " auf "data science " in der Zeichenfolge "data science rocks!" passen.
Nutzen wir das Gelernte, um die Spalte response_var im Datensatz gathered_data aus der vorherigen Lektion anzupassen.
Diese Übung ist Teil des Kurses
Kategorische Daten im Tidyverse
Anleitung zur Übung
- Verwende
str_remove, um in der Spalteresponse_varalles vor und einschließlich „rude to “ (mit dem Leerzeichen am Ende) zu entfernen. - Verwende
str_remove, um „on a plane“ aus der Spalteresponse_varzu entfernen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
gathered_data %>%
# Remove everything before and including "rude to " (with that space at the end!)
mutate(response_var = ___(response_var, ___)) %>%
# Remove "on a plane"
mutate(response_var = ___(response_var, ___))