Mehrere Variablen pro Spalte
Weil du viel um die Ohren hast, willst du nicht zu viel Zeit auf Netflix verbringen. Also rechnest du vorab ein bisschen mit den Laufzeiten von Serien und Filmen, bevor du entscheidest, was du dir ansiehst.
Du hast einen Datensatz namens netflix_df bekommen, aber die Spalte duration hat ein Problem. Sie enthält Strings mit Wert und Einheit der Dauer ("min" oder "Season").
Du bringst diesen Datensatz in eine saubere Form, sodass jede Variable ihre eigene Spalte bekommt.
Wie in diesem Kurs immer der Fall, wurde das Paket tidyr bereits für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Daten umformen mit tidyr</Kurs>Übungsanweisungen
- Untersuche
netflix_df, indem du den Namen direkt in die R-Konsole eingibst und Enter drückst, um zu sehen, welches Zeichen in der Spaltedurationden Wert von der Einheit trennt. - Trenne die Spalte
durationin zwei Variablen namensvalueundunit. Übergebe das Zeichen, das die Zahl von der Einheit trennt, an das Argumentsep.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
netflix_df %>%
# Split the duration column into value and unit columns
separate(___, into = ___, sep = ___, convert = TRUE)