Mehrere Variablen pro Spalte
Weil du viel um die Ohren hast, willst du nicht zu viel Zeit auf Netflix verbringen. Also rechnest du vorab ein bisschen mit den Laufzeiten von Serien und Filmen, bevor du entscheidest, was du dir ansiehst.
Du hast einen Datensatz namens netflix_df bekommen, aber die Spalte duration hat ein Problem. Sie enthält Strings mit Wert und Einheit der Dauer ("min" oder "Season").
Du bringst diesen Datensatz in eine saubere Form, sodass jede Variable ihre eigene Spalte bekommt.
Wie in diesem Kurs immer der Fall, wurde das Paket tidyr bereits für dich geladen.
Diese Übung ist Teil des Kurses
Daten umformen mit tidyr
Anleitung zur Übung
- Untersuche
netflix_df, indem du den Namen direkt in die R-Konsole eingibst und Enter drückst, um zu sehen, welches Zeichen in der Spaltedurationden Wert von der Einheit trennt. - Trenne die Spalte
durationin zwei Variablen namensvalueundunit. Übergebe das Zeichen, das die Zahl von der Einheit trennt, an das Argumentsep.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
netflix_df %>%
# Split the duration column into value and unit columns
separate(___, into = ___, sep = ___, convert = TRUE)