Conserver les modalités les plus fréquentes
Parfois, vous ne souhaitez pas conserver les modalités selon leur proportion, mais plutôt les n plus fréquentes. Observons comment les modalités conservées pour MLMethodNextYearSelect changent lorsque l’on conserve par nombre plutôt que par proportion. multiple_choice_responses a été chargé pour vous.
Cet exercice fait partie du cours
Données catégorielles dans le Tidyverse
Instructions
- Supprimez les personnes qui n’ont pas sélectionné de méthode.
- Créez une nouvelle variable,
ml_method, à partir deMLMethodNextYearSelectqui préserve les 5 intitulés les plus fréquents et regroupe le reste sous "other method" en utilisant l’argumentother_level. - Comptez la fréquence de chaque
ml_method, en triant par ordre décroissant.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
multiple_choice_responses %>%
# Remove NAs
filter(___) %>%
# Create ml_method, retaining the 5 most common methods and renaming others "other method"
mutate(ml_method = ___(MLMethodNextYearSelect, ___, other_level = ___)) %>%
# Count the frequency of your new variable, sorted in descending order
___(ml_method, ___)