De meest voorkomende niveaus behouden
Soms wil je niveaus niet op basis van proportie behouden, maar juist de meest voorkomende n niveaus. Laten we kijken hoe de behouden niveaus voor MLMethodNextYearSelect veranderen wanneer we op aantal in plaats van proportie selecteren. multiple_choice_responses is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Categorische gegevens in de Tidyverse
Oefeninstructies
- Verwijder mensen die geen methode hebben geselecteerd.
- Maak een nieuwe variabele,
ml_method, op basis vanMLMethodNextYearSelectdie de 5 meest voorkomende titels behoudt en de rest samenvoegt als "other method" met behulp van het argumentother_level. - Tel hoe vaak elke
ml_methodvoorkomt en sorteer aflopend.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
multiple_choice_responses %>%
# Remove NAs
filter(___) %>%
# Create ml_method, retaining the 5 most common methods and renaming others "other method"
mutate(ml_method = ___(MLMethodNextYearSelect, ___, other_level = ___)) %>%
# Count the frequency of your new variable, sorted in descending order
___(ml_method, ___)