Agrupando e remodelando colunas semelhantes
Nesta lição, vimos como algumas colunas do conjunto de dados da pesquisa de data science do Kaggle estão relacionadas entre si, como as colunas que tratam da frequência de diferentes desafios no trabalho. Geralmente, queremos analisar essas variáveis em conjunto, mas antes precisamos encontrá-las e transformá-las para um formato mais fácil de usar. Vamos aplicar esse processo às perguntas sobre o quão úteis os participantes da pesquisa consideraram diferentes plataformas de aprendizado.
O conjunto de dados multiple_choice_responses já foi carregado para você.
Este exercício faz parte do curso
Dados Categóricos no Tidyverse
Instruções do exercício
- Selecione apenas as colunas que têm
"LearningPlatformUsefulness"no nome. - Converta os dados do formato largo para o longo com duas colunas,
learning_platformeusefulness. - Remova as linhas em que
usefulnessé NA. - Remova
"LearningPlatformUsefulness"de cada string emlearning_platform.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
learning_platform_usefulness <- multiple_choice_responses %>%
# Select columns with LearningPlatformUsefulness in title
___(___("LearningPlatformUsefulness")) %>%
# Change data from wide to long
___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
# Remove rows where usefulness is NA
___(___()) %>%
# Remove "LearningPlatformUsefulness" from each string in learning_platform
mutate(learning_platform = ___())