ComeçarComece de graça

Agrupando e remodelando colunas semelhantes

Nesta lição, vimos como algumas colunas do conjunto de dados da pesquisa de data science do Kaggle estão relacionadas entre si, como as colunas que tratam da frequência de diferentes desafios no trabalho. Geralmente, queremos analisar essas variáveis em conjunto, mas antes precisamos encontrá-las e transformá-las para um formato mais fácil de usar. Vamos aplicar esse processo às perguntas sobre o quão úteis os participantes da pesquisa consideraram diferentes plataformas de aprendizado.

O conjunto de dados multiple_choice_responses já foi carregado para você.

Este exercício faz parte do curso

Dados Categóricos no Tidyverse

Ver curso

Instruções do exercício

  • Selecione apenas as colunas que têm "LearningPlatformUsefulness" no nome.
  • Converta os dados do formato largo para o longo com duas colunas, learning_platform e usefulness.
  • Remova as linhas em que usefulness é NA.
  • Remova "LearningPlatformUsefulness" de cada string em learning_platform.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

learning_platform_usefulness <- multiple_choice_responses %>%
  # Select columns with LearningPlatformUsefulness in title
  ___(___("LearningPlatformUsefulness")) %>%
  # Change data from wide to long
  ___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
  # Remove rows where usefulness is NA
  ___(___()) %>%
  # Remove "LearningPlatformUsefulness" from each string in learning_platform 
  mutate(learning_platform = ___())
Editar e executar o código