Raggruppare e rimodellare colonne simili
In questa lezione, abbiamo visto come alcune colonne del dataset del sondaggio di data science su Kaggle fossero collegate tra loro, ad esempio le colonne che indicano la frequenza di diverse sfide lavorative. Di solito vogliamo analizzare quelle variabili insieme, ma prima dobbiamo individuarle e trasformarle in un formato più facile da usare. Proviamo il processo con le domande su quanto gli intervistati abbiano trovato utili le diverse piattaforme per l'apprendimento.
Il dataset multiple_choice_responses è già stato caricato per te.
Questo esercizio fa parte del corso
Dati categoriali nel Tidyverse
Istruzioni dell'esercizio
- Seleziona solo le colonne con
"LearningPlatformUsefulness"nel nome. - Trasforma i dati dal formato wide al formato long con due colonne,
learning_platformeusefulness. - Rimuovi le righe in cui
usefulnessè NA. - Rimuovi
"LearningPlatformUsefulness"da ogni stringa inlearning_platform.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
learning_platform_usefulness <- multiple_choice_responses %>%
# Select columns with LearningPlatformUsefulness in title
___(___("LearningPlatformUsefulness")) %>%
# Change data from wide to long
___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
# Remove rows where usefulness is NA
___(___()) %>%
# Remove "LearningPlatformUsefulness" from each string in learning_platform
mutate(learning_platform = ___())