Ähnliche Spalten gruppieren und umformen
In dieser Lesson haben wir gesehen, dass einige Spalten im Kaggle-Datenscience-Umfragedatensatz zusammengehören, zum Beispiel Spalten, die jeweils die Häufigkeit verschiedener Herausforderungen bei der Arbeit abfragen. Solche Variablen wollen wir meist gemeinsam betrachten, müssen sie dafür aber erst finden und in ein besser nutzbares Format bringen. Probieren wir das mit den Fragen dazu aus, wie nützlich die Befragten verschiedene Lernplattformen fanden.
Der Datensatz multiple_choice_responses ist für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Kategorische Daten im Tidyverse</Kurs>Übungsanweisungen
- Wähle nur die Spalten aus, die im Namen
"LearningPlatformUsefulness"enthalten. - Wandle die Daten vom Wide- ins Long-Format mit zwei Spalten um:
learning_platformundusefulness. - Entferne Zeilen, in denen
usefulnessNA ist. - Entferne
"LearningPlatformUsefulness"aus jeder Zeichenkette inlearning_platform.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
learning_platform_usefulness <- multiple_choice_responses %>%
# Select columns with LearningPlatformUsefulness in title
___(___("LearningPlatformUsefulness")) %>%
# Change data from wide to long
___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
# Remove rows where usefulness is NA
___(___()) %>%
# Remove "LearningPlatformUsefulness" from each string in learning_platform
mutate(learning_platform = ___())