CommencerCommencer gratuitement

Regrouper et remodeler des colonnes similaires

Dans cette leçon, nous avons vu que certaines colonnes de l’enquête Kaggle sur la data science étaient liées, par exemple celles qui portent sur la fréquence des différents défis au travail. Nous voulons généralement analyser ces variables ensemble, mais il faut d’abord les repérer et les transformer dans un format plus simple à utiliser. Essayons ce processus avec les questions sur l’utilité perçue des différentes plateformes d’apprentissage par les répondants.

Le jeu de données multiple_choice_responses a été chargé pour vous.

Cet exercice fait partie du cours

Données catégorielles dans le Tidyverse

Afficher le cours

Instructions

  • Sélectionnez uniquement les colonnes dont le nom contient "LearningPlatformUsefulness".
  • Passez du format large au format long avec deux colonnes, learning_platform et usefulness.
  • Supprimez les lignes où usefulness vaut NA.
  • Supprimez "LearningPlatformUsefulness" de chaque chaîne dans learning_platform.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

learning_platform_usefulness <- multiple_choice_responses %>%
  # Select columns with LearningPlatformUsefulness in title
  ___(___("LearningPlatformUsefulness")) %>%
  # Change data from wide to long
  ___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
  # Remove rows where usefulness is NA
  ___(___()) %>%
  # Remove "LearningPlatformUsefulness" from each string in learning_platform 
  mutate(learning_platform = ___())
Modifier et exécuter le code