Ähnliche Spalten gruppieren und umformen
In dieser Lesson haben wir gesehen, dass einige Spalten im Kaggle-Datenscience-Umfragedatensatz zusammengehören, zum Beispiel Spalten, die jeweils die Häufigkeit verschiedener Herausforderungen bei der Arbeit abfragen. Solche Variablen wollen wir meist gemeinsam betrachten, müssen sie dafür aber erst finden und in ein besser nutzbares Format bringen. Probieren wir das mit den Fragen dazu aus, wie nützlich die Befragten verschiedene Lernplattformen fanden.
Der Datensatz multiple_choice_responses ist für dich geladen.
Diese Übung ist Teil des Kurses
Kategorische Daten im Tidyverse
Anleitung zur Übung
- Wähle nur die Spalten aus, die im Namen
"LearningPlatformUsefulness"enthalten. - Wandle die Daten vom Wide- ins Long-Format mit zwei Spalten um:
learning_platformundusefulness. - Entferne Zeilen, in denen
usefulnessNA ist. - Entferne
"LearningPlatformUsefulness"aus jeder Zeichenkette inlearning_platform.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
learning_platform_usefulness <- multiple_choice_responses %>%
# Select columns with LearningPlatformUsefulness in title
___(___("LearningPlatformUsefulness")) %>%
# Change data from wide to long
___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
# Remove rows where usefulness is NA
___(___()) %>%
# Remove "LearningPlatformUsefulness" from each string in learning_platform
mutate(learning_platform = ___())