LoslegenKostenlos loslegen

Ähnliche Spalten gruppieren und umformen

In dieser Lesson haben wir gesehen, dass einige Spalten im Kaggle-Datenscience-Umfragedatensatz zusammengehören, zum Beispiel Spalten, die jeweils die Häufigkeit verschiedener Herausforderungen bei der Arbeit abfragen. Solche Variablen wollen wir meist gemeinsam betrachten, müssen sie dafür aber erst finden und in ein besser nutzbares Format bringen. Probieren wir das mit den Fragen dazu aus, wie nützlich die Befragten verschiedene Lernplattformen fanden.

Der Datensatz multiple_choice_responses ist für dich geladen.

Diese Übung ist Teil des Kurses

Kategorische Daten im Tidyverse

Kurs anzeigen

Anleitung zur Übung

  • Wähle nur die Spalten aus, die im Namen "LearningPlatformUsefulness" enthalten.
  • Wandle die Daten vom Wide- ins Long-Format mit zwei Spalten um: learning_platform und usefulness.
  • Entferne Zeilen, in denen usefulness NA ist.
  • Entferne "LearningPlatformUsefulness" aus jeder Zeichenkette in learning_platform.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

learning_platform_usefulness <- multiple_choice_responses %>%
  # Select columns with LearningPlatformUsefulness in title
  ___(___("LearningPlatformUsefulness")) %>%
  # Change data from wide to long
  ___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
  # Remove rows where usefulness is NA
  ___(___()) %>%
  # Remove "LearningPlatformUsefulness" from each string in learning_platform 
  mutate(learning_platform = ___())
Code bearbeiten und ausführen