Mutters kleiner Helfer (2)

Eine allgemeinere Möglichkeit, Spalten abzugleichen, besteht darin zu prüfen, ob ihre Namen einen Wert irgendwo enthalten (statt mit einem Wert zu beginnen oder zu enden). Wie du dir denken kannst, geht das mit dem Helper contains().

Noch allgemeiner kannst du Spalten mithilfe regulärer Ausdrücke abgleichen. Reguläre Ausdrücke (kurz „Regex“) sind eine mächtige Sprache, um Text zu matchen. Wenn du lernen willst, wie man reguläre Ausdrücke verwendet, mach den Kurs *String Manipulation with stringr in R *. Für den Moment musst du nur drei Dinge wissen.

a: Ein Buchstabe bedeutet „diesen Buchstaben matchen“.
.: Ein Punkt bedeutet „beliebiges Zeichen matchen, einschließlich Buchstaben, Zahlen, Satzzeichen usw.“.
?: Ein Fragezeichen bedeutet „das vorherige Zeichen ist optional“.

Spalten, die auf einen bestimmten Regex passen, findest du mit dem Select-Helper matches().

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Spark mit sparklyr in R</Kurs>

Kurs ansehen

Übungsanweisungen

Eine Spark-Verbindung wurde für dich als spark_conn erstellt. Eine an die in Spark gespeicherten Track-Metadaten angebundene Tibble wurde als track_metadata_tbl vordefiniert.

Wähle alle Spalten aus track_metadata_tbl aus, die "ti" enthalten.
Wähle alle Spalten aus track_metadata_tbl aus, die dem regulären Ausdruck "ti.?t" entsprechen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# track_metadata_tbl has been pre-defined
track_metadata_tbl

track_metadata_tbl %>%
  # Select columns containing ti
  ___

track_metadata_tbl %>%
  # Select columns matching ti.?t
  ___

Code bearbeiten und ausführen