LoslegenKostenlos loslegen

Mamas kleiner Helfer (1)

Wenn dein Datensatz Tausende von Spalten hat und du viele davon auswählen willst, kann es sehr mühsam sein, beim Aufruf von select() jeden Spaltennamen einzeln zu tippen. Zum Glück gibt es für select() einige Hilfsfunktionen, mit denen du mehrere Spalten auswählen kannst, ohne viel Code zu schreiben.

Zu diesen Helfern gehören starts_with() und ends_with(). Sie finden Spalten, die jeweils mit einem bestimmten Präfix beginnen oder mit einem bestimmten Suffix enden. Aufgrund der speziellen Codeauswertung von dplyr können diese Funktionen nur innerhalb eines Aufrufs von select() verwendet werden; für sich allein genommen ergeben sie keinen Sinn.

Diese Übung ist Teil des Kurses

Einführung in Spark mit sparklyr in R

Kurs anzeigen

Anleitung zur Übung

Eine Spark-Verbindung wurde für dich als spark_conn erstellt. Eine Tibble, die mit den in Spark gespeicherten Track-Metadaten verknüpft ist, wurde als track_metadata_tbl vordefiniert.

  • Wähle alle Spalten aus track_metadata_tbl aus, die mit "artist" beginnen.
  • Wähle alle Spalten aus track_metadata_tbl aus, die mit "id" enden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# track_metadata_tbl has been pre-defined
track_metadata_tbl

track_metadata_tbl %>%
  # Select columns starting with artist
  ___

track_metadata_tbl %>%
  # Select columns ending with id
  ___
Code bearbeiten und ausführen