CommencerCommencer gratuitement

Conserver les modalités les plus fréquentes

Parfois, vous ne souhaitez pas conserver les modalités selon leur proportion, mais plutôt les n plus fréquentes. Observons comment les modalités conservées pour MLMethodNextYearSelect changent lorsque l’on conserve par nombre plutôt que par proportion. multiple_choice_responses a été chargé pour vous.

Cet exercice fait partie du cours

Données catégorielles dans le Tidyverse

Afficher le cours

Instructions

  • Supprimez les personnes qui n’ont pas sélectionné de méthode.
  • Créez une nouvelle variable, ml_method, à partir de MLMethodNextYearSelect qui préserve les 5 intitulés les plus fréquents et regroupe le reste sous "other method" en utilisant l’argument other_level.
  • Comptez la fréquence de chaque ml_method, en triant par ordre décroissant.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

multiple_choice_responses %>%
  # Remove NAs 
  filter(___) %>%
  # Create ml_method, retaining the 5 most common methods and renaming others "other method" 
  mutate(ml_method = ___(MLMethodNextYearSelect, ___, other_level = ___)) %>%
  # Count the frequency of your new variable, sorted in descending order
  ___(ml_method, ___)
Modifier et exécuter le code