CommencerCommencer gratuitement

Regrouper manuellement des modalités

Le sondage proposait 16 intitulés de poste (dont « Other ») parmi lesquels les personnes pouvaient choisir. Regroupons-les en quelques grandes catégories : « Computer Scientist », « Data analyst/scientist/engineer », « Researcher » et « Other ». Le jeu de données multiple_choice_responses a été chargé pour vous.

Cet exercice fait partie du cours

Données catégorielles dans le Tidyverse

Afficher le cours

Instructions

  • Regroupez les modalités de CurrentJobTitleSelect dans une nouvelle variable grouped_titles.
  • Puis, à partir de grouped_titles, placez tout ce qui n’est pas l’un de ces trois intitulés regroupés dans « Other Title ».
  • Enfin, calculez l’effectif de tous les intitulés regroupés.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

multiple_choice_responses %>%
    # Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
    ___(grouped_titles = ___(CurrentJobTitleSelect, 
        "Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"), 
        "Researcher" = "Scientist/Researcher", 
        "Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist", 
                                              "Business Analyst", "Data Analyst", 
                                              "Data Miner", "Predictive Modeler"))) %>%
    # Keep all the new titles and turn every other title into "Other"
    ___(grouped_titles = ___(grouped_titles, 
                             ___ = c("Computer Scientist", 
                                     "Researcher", 
                                     "Data Analyst/Scientist/Engineer"))) %>% 
    # Get a count of the grouped titles
    ___(___)
Modifier et exécuter le code