Levels handmatig samenvoegen
Er zijn 16 functietitels (inclusief "Other") die mensen in de enquête konden selecteren. Laten we die samenvoegen tot een paar grote categorieën: "Computer Scientist", "Data analyst/scientist/engineer", "Researcher" en "Other". De gegevensset multiple_choice_responses is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Categorische gegevens in de Tidyverse
Oefeninstructies
- Voeg de levels van
CurrentJobTitleSelectsamen tot een nieuwe variabele,grouped_titles. - Neem vervolgens
grouped_titlesen zet alles wat niet een van die drie gegroepeerde titels is in "Other Title". - Haal tot slot de telling op van alle gegroepeerde titels.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
multiple_choice_responses %>%
# Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
___(grouped_titles = ___(CurrentJobTitleSelect,
"Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"),
"Researcher" = "Scientist/Researcher",
"Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist",
"Business Analyst", "Data Analyst",
"Data Miner", "Predictive Modeler"))) %>%
# Keep all the new titles and turn every other title into "Other"
___(grouped_titles = ___(grouped_titles,
___ = c("Computer Scientist",
"Researcher",
"Data Analyst/Scientist/Engineer"))) %>%
# Get a count of the grouped titles
___(___)