Preservare i livelli più comuni
A volte non vuoi mantenere i livelli in base alla proporzione, ma piuttosto i n livelli più comuni. Vediamo come cambiano i livelli mantenuti per MLMethodNextYearSelect quando li conserviamo per numero invece che per proporzione. multiple_choice_responses è già stato caricato per te.
Questo esercizio fa parte del corso
Dati categoriali nel Tidyverse
Istruzioni dell'esercizio
- Rimuovi le persone che non hanno selezionato un metodo.
- Crea una nuova variabile,
ml_method, daMLMethodNextYearSelectche preservi i 5 titoli più comuni e raggruppi gli altri come "other method" usando l'argomentoother_level. - Conta la frequenza di ciascun
ml_method, ordinando in ordine decrescente.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
multiple_choice_responses %>%
# Remove NAs
filter(___) %>%
# Create ml_method, retaining the 5 most common methods and renaming others "other method"
mutate(ml_method = ___(MLMethodNextYearSelect, ___, other_level = ___)) %>%
# Count the frequency of your new variable, sorted in descending order
___(ml_method, ___)