Preservando os níveis mais comuns
Às vezes, você não quer manter níveis por proporção, e sim os n níveis mais comuns. Vamos ver como os níveis resultantes mantidos para MLMethodNextYearSelect mudam quando mantemos por quantidade em vez de proporção. multiple_choice_responses já foi carregado para você.
Este exercício faz parte do curso
Dados Categóricos no Tidyverse
Instruções do exercício
- Remova as pessoas que não selecionaram um método.
- Crie uma nova variável,
ml_method, a partir deMLMethodNextYearSelect, que preserve os 5 títulos mais comuns e agrupe o restante como "other method" usando o argumentoother_level. - Conte a frequência de cada
ml_method, ordenando em ordem decrescente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
multiple_choice_responses %>%
# Remove NAs
filter(___) %>%
# Create ml_method, retaining the 5 most common methods and renaming others "other method"
mutate(ml_method = ___(MLMethodNextYearSelect, ___, other_level = ___)) %>%
# Count the frequency of your new variable, sorted in descending order
___(ml_method, ___)