LoslegenKostenlos starten

Ähnliche Spalten gruppieren und umformen

In dieser Lesson haben wir gesehen, dass einige Spalten im Kaggle-Datenscience-Umfragedatensatz zusammengehören, zum Beispiel Spalten, die jeweils die Häufigkeit verschiedener Herausforderungen bei der Arbeit abfragen. Solche Variablen wollen wir meist gemeinsam betrachten, müssen sie dafür aber erst finden und in ein besser nutzbares Format bringen. Probieren wir das mit den Fragen dazu aus, wie nützlich die Befragten verschiedene Lernplattformen fanden.

Der Datensatz multiple_choice_responses ist für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>Kategorische Daten im Tidyverse</Kurs>
Kurs ansehen

Übungsanweisungen

  • Wähle nur die Spalten aus, die im Namen "LearningPlatformUsefulness" enthalten.
  • Wandle die Daten vom Wide- ins Long-Format mit zwei Spalten um: learning_platform und usefulness.
  • Entferne Zeilen, in denen usefulness NA ist.
  • Entferne "LearningPlatformUsefulness" aus jeder Zeichenkette in learning_platform.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

learning_platform_usefulness <- multiple_choice_responses %>%
  # Select columns with LearningPlatformUsefulness in title
  ___(___("LearningPlatformUsefulness")) %>%
  # Change data from wide to long
  ___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
  # Remove rows where usefulness is NA
  ___(___()) %>%
  # Remove "LearningPlatformUsefulness" from each string in learning_platform 
  mutate(learning_platform = ___())
Code bearbeiten und ausführen