Mamas kleiner Helfer (1)
Wenn dein Datensatz Tausende von Spalten hat und du viele davon auswählen willst, kann es sehr mühsam sein, beim Aufruf von select() jeden Spaltennamen einzeln zu tippen. Zum Glück gibt es für select() einige Hilfsfunktionen, mit denen du mehrere Spalten auswählen kannst, ohne viel Code zu schreiben.
Zu diesen Helfern gehören starts_with() und ends_with(). Sie finden Spalten, die jeweils mit einem bestimmten Präfix beginnen oder mit einem bestimmten Suffix enden. Aufgrund der speziellen Codeauswertung von dplyr können diese Funktionen nur innerhalb eines Aufrufs von select() verwendet werden; für sich allein genommen ergeben sie keinen Sinn.
Diese Übung ist Teil des Kurses
Einführung in Spark mit sparklyr in R
Anleitung zur Übung
Eine Spark-Verbindung wurde für dich als spark_conn erstellt. Eine Tibble, die mit den in Spark gespeicherten Track-Metadaten verknüpft ist, wurde als track_metadata_tbl vordefiniert.
- Wähle alle Spalten aus
track_metadata_tblaus, die mit"artist"beginnen. - Wähle alle Spalten aus
track_metadata_tblaus, die mit"id"enden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# track_metadata_tbl has been pre-defined
track_metadata_tbl
track_metadata_tbl %>%
# Select columns starting with artist
___
track_metadata_tbl %>%
# Select columns ending with id
___