Mutters kleiner Helfer (2)
Eine allgemeinere Möglichkeit, Spalten abzugleichen, besteht darin zu prüfen, ob ihre Namen einen Wert irgendwo enthalten (statt mit einem Wert zu beginnen oder zu enden). Wie du dir denken kannst, geht das mit dem Helper contains().
Noch allgemeiner kannst du Spalten mithilfe regulärer Ausdrücke abgleichen. Reguläre Ausdrücke (kurz „Regex“) sind eine mächtige Sprache, um Text zu matchen. Wenn du lernen willst, wie man reguläre Ausdrücke verwendet, mach den Kurs *String Manipulation with stringr in R *. Für den Moment musst du nur drei Dinge wissen.
a: Ein Buchstabe bedeutet „diesen Buchstaben matchen“..: Ein Punkt bedeutet „beliebiges Zeichen matchen, einschließlich Buchstaben, Zahlen, Satzzeichen usw.“.?: Ein Fragezeichen bedeutet „das vorherige Zeichen ist optional“.
Spalten, die auf einen bestimmten Regex passen, findest du mit dem Select-Helper matches().
Diese Übung ist Teil des Kurses
Einführung in Spark mit sparklyr in R
Anleitung zur Übung
Eine Spark-Verbindung wurde für dich als spark_conn erstellt. Eine an die in Spark gespeicherten Track-Metadaten angebundene Tibble wurde als track_metadata_tbl vordefiniert.
- Wähle alle Spalten aus
track_metadata_tblaus, die"ti"enthalten. - Wähle alle Spalten aus
track_metadata_tblaus, die dem regulären Ausdruck"ti.?t"entsprechen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# track_metadata_tbl has been pre-defined
track_metadata_tbl
track_metadata_tbl %>%
# Select columns containing ti
___
track_metadata_tbl %>%
# Select columns matching ti.?t
___