Raggruppare manualmente i livelli
Nel sondaggio erano presenti 16 titoli di lavoro (incluso "Other") tra cui le persone potevano scegliere. Raggruppiamoli in alcune grandi categorie: "Computer Scientist", "Data analyst/scientist/engineer", "Researcher" e "Other". Il dataset multiple_choice_responses è già stato caricato per te.
Questo esercizio fa parte del corso
Dati categoriali nel Tidyverse
Istruzioni dell'esercizio
- Raggruppa i livelli di
CurrentJobTitleSelectin una nuova variabile,grouped_titles. - Poi prendi
grouped_titlese metti tutto ciò che non corrisponde a uno di quei tre titoli raggruppati in "Other Title". - Infine, ottieni il conteggio di tutti i titoli raggruppati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
multiple_choice_responses %>%
# Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
___(grouped_titles = ___(CurrentJobTitleSelect,
"Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"),
"Researcher" = "Scientist/Researcher",
"Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist",
"Business Analyst", "Data Analyst",
"Data Miner", "Predictive Modeler"))) %>%
# Keep all the new titles and turn every other title into "Other"
___(grouped_titles = ___(grouped_titles,
___ = c("Computer Scientist",
"Researcher",
"Data Analyst/Scientist/Engineer"))) %>%
# Get a count of the grouped titles
___(___)