LoslegenKostenlos loslegen

Mehrere Variablen pro Spalte

Weil du viel um die Ohren hast, willst du nicht zu viel Zeit auf Netflix verbringen. Also rechnest du vorab ein bisschen mit den Laufzeiten von Serien und Filmen, bevor du entscheidest, was du dir ansiehst. Du hast einen Datensatz namens netflix_df bekommen, aber die Spalte duration hat ein Problem. Sie enthält Strings mit Wert und Einheit der Dauer ("min" oder "Season").

Du bringst diesen Datensatz in eine saubere Form, sodass jede Variable ihre eigene Spalte bekommt.

Wie in diesem Kurs immer der Fall, wurde das Paket tidyr bereits für dich geladen.

Diese Übung ist Teil des Kurses

Daten umformen mit tidyr

Kurs anzeigen

Anleitung zur Übung

  • Untersuche netflix_df, indem du den Namen direkt in die R-Konsole eingibst und Enter drückst, um zu sehen, welches Zeichen in der Spalte duration den Wert von der Einheit trennt.
  • Trenne die Spalte duration in zwei Variablen namens value und unit. Übergebe das Zeichen, das die Zahl von der Einheit trennt, an das Argument sep.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

netflix_df %>% 
  # Split the duration column into value and unit columns
  separate(___, into = ___, sep = ___, convert = TRUE)
Code bearbeiten und ausführen