LoslegenKostenlos starten

Mehrere Variablen pro Spalte

Weil du viel um die Ohren hast, willst du nicht zu viel Zeit auf Netflix verbringen. Also rechnest du vorab ein bisschen mit den Laufzeiten von Serien und Filmen, bevor du entscheidest, was du dir ansiehst. Du hast einen Datensatz namens netflix_df bekommen, aber die Spalte duration hat ein Problem. Sie enthält Strings mit Wert und Einheit der Dauer ("min" oder "Season").

Du bringst diesen Datensatz in eine saubere Form, sodass jede Variable ihre eigene Spalte bekommt.

Wie in diesem Kurs immer der Fall, wurde das Paket tidyr bereits für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>Daten umformen mit tidyr</Kurs>
Kurs ansehen

Übungsanweisungen

  • Untersuche netflix_df, indem du den Namen direkt in die R-Konsole eingibst und Enter drückst, um zu sehen, welches Zeichen in der Spalte duration den Wert von der Einheit trennt.
  • Trenne die Spalte duration in zwei Variablen namens value und unit. Übergebe das Zeichen, das die Zahl von der Einheit trennt, an das Argument sep.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

netflix_df %>% 
  # Split the duration column into value and unit columns
  separate(___, into = ___, sep = ___, convert = TRUE)
Code bearbeiten und ausführen