Aan de slagGa gratis aan de slag

Levels handmatig samenvoegen

Er zijn 16 functietitels (inclusief "Other") die mensen in de enquête konden selecteren. Laten we die samenvoegen tot een paar grote categorieën: "Computer Scientist", "Data analyst/scientist/engineer", "Researcher" en "Other". De gegevensset multiple_choice_responses is alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Categorische gegevens in de Tidyverse

Cursus bekijken

Oefeninstructies

  • Voeg de levels van CurrentJobTitleSelect samen tot een nieuwe variabele, grouped_titles.
  • Neem vervolgens grouped_titles en zet alles wat niet een van die drie gegroepeerde titels is in "Other Title".
  • Haal tot slot de telling op van alle gegroepeerde titels.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

multiple_choice_responses %>%
    # Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
    ___(grouped_titles = ___(CurrentJobTitleSelect, 
        "Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"), 
        "Researcher" = "Scientist/Researcher", 
        "Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist", 
                                              "Business Analyst", "Data Analyst", 
                                              "Data Miner", "Predictive Modeler"))) %>%
    # Keep all the new titles and turn every other title into "Other"
    ___(grouped_titles = ___(grouped_titles, 
                             ___ = c("Computer Scientist", 
                                     "Researcher", 
                                     "Data Analyst/Scientist/Engineer"))) %>% 
    # Get a count of the grouped titles
    ___(___)
Code bewerken en uitvoeren