Regrouper manuellement des modalités
Le sondage proposait 16 intitulés de poste (dont « Other ») parmi lesquels les personnes pouvaient choisir. Regroupons-les en quelques grandes catégories : « Computer Scientist », « Data analyst/scientist/engineer », « Researcher » et « Other ». Le jeu de données multiple_choice_responses a été chargé pour vous.
Cet exercice fait partie du cours
Données catégorielles dans le Tidyverse
Instructions
- Regroupez les modalités de
CurrentJobTitleSelectdans une nouvelle variablegrouped_titles. - Puis, à partir de
grouped_titles, placez tout ce qui n’est pas l’un de ces trois intitulés regroupés dans « Other Title ». - Enfin, calculez l’effectif de tous les intitulés regroupés.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
multiple_choice_responses %>%
# Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
___(grouped_titles = ___(CurrentJobTitleSelect,
"Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"),
"Researcher" = "Scientist/Researcher",
"Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist",
"Business Analyst", "Data Analyst",
"Data Miner", "Predictive Modeler"))) %>%
# Keep all the new titles and turn every other title into "Other"
___(grouped_titles = ___(grouped_titles,
___ = c("Computer Scientist",
"Researcher",
"Data Analyst/Scientist/Engineer"))) %>%
# Get a count of the grouped titles
___(___)