ComeçarComece de graça

Preservando os níveis mais comuns

Às vezes, você não quer manter níveis por proporção, e sim os n níveis mais comuns. Vamos ver como os níveis resultantes mantidos para MLMethodNextYearSelect mudam quando mantemos por quantidade em vez de proporção. multiple_choice_responses já foi carregado para você.

Este exercício faz parte do curso

Dados Categóricos no Tidyverse

Ver curso

Instruções do exercício

  • Remova as pessoas que não selecionaram um método.
  • Crie uma nova variável, ml_method, a partir de MLMethodNextYearSelect, que preserve os 5 títulos mais comuns e agrupe o restante como "other method" usando o argumento other_level.
  • Conte a frequência de cada ml_method, ordenando em ordem decrescente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

multiple_choice_responses %>%
  # Remove NAs 
  filter(___) %>%
  # Create ml_method, retaining the 5 most common methods and renaming others "other method" 
  mutate(ml_method = ___(MLMethodNextYearSelect, ___, other_level = ___)) %>%
  # Count the frequency of your new variable, sorted in descending order
  ___(ml_method, ___)
Editar e executar o código