Raggruppare manualmente i livelli

Nel sondaggio erano presenti 16 titoli di lavoro (incluso "Other") tra cui le persone potevano scegliere. Raggruppiamoli in alcune grandi categorie: "Computer Scientist", "Data analyst/scientist/engineer", "Researcher" e "Other". Il dataset multiple_choice_responses è già stato caricato per te.

Questo esercizio fa parte del corso

Dati categoriali nel Tidyverse

Visualizza corso

Istruzioni dell'esercizio

Raggruppa i livelli di CurrentJobTitleSelect in una nuova variabile, grouped_titles.
Poi prendi grouped_titles e metti tutto ciò che non corrisponde a uno di quei tre titoli raggruppati in "Other Title".
Infine, ottieni il conteggio di tutti i titoli raggruppati.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

multiple_choice_responses %>%
    # Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
    ___(grouped_titles = ___(CurrentJobTitleSelect, 
        "Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"), 
        "Researcher" = "Scientist/Researcher", 
        "Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist", 
                                              "Business Analyst", "Data Analyst", 
                                              "Data Miner", "Predictive Modeler"))) %>%
    # Keep all the new titles and turn every other title into "Other"
    ___(grouped_titles = ___(grouped_titles, 
                             ___ = c("Computer Scientist", 
                                     "Researcher", 
                                     "Data Analyst/Scientist/Engineer"))) %>% 
    # Get a count of the grouped titles
    ___(___)

Modifica ed esegui il codice