Regrouper et remodeler des colonnes similaires
Dans cette leçon, nous avons vu que certaines colonnes de l’enquête Kaggle sur la data science étaient liées, par exemple celles qui portent sur la fréquence des différents défis au travail. Nous voulons généralement analyser ces variables ensemble, mais il faut d’abord les repérer et les transformer dans un format plus simple à utiliser. Essayons ce processus avec les questions sur l’utilité perçue des différentes plateformes d’apprentissage par les répondants.
Le jeu de données multiple_choice_responses a été chargé pour vous.
Cet exercice fait partie du cours
Données catégorielles dans le Tidyverse
Instructions
- Sélectionnez uniquement les colonnes dont le nom contient
"LearningPlatformUsefulness". - Passez du format large au format long avec deux colonnes,
learning_platformetusefulness. - Supprimez les lignes où
usefulnessvaut NA. - Supprimez
"LearningPlatformUsefulness"de chaque chaîne danslearning_platform.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
learning_platform_usefulness <- multiple_choice_responses %>%
# Select columns with LearningPlatformUsefulness in title
___(___("LearningPlatformUsefulness")) %>%
# Change data from wide to long
___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
# Remove rows where usefulness is NA
___(___()) %>%
# Remove "LearningPlatformUsefulness" from each string in learning_platform
mutate(learning_platform = ___())