Aan de slagBegin gratis

Levels handmatig samenvoegen

Er zijn 16 functietitels (inclusief "Other") die mensen in de enquête konden selecteren. Laten we die samenvoegen tot een paar grote categorieën: "Computer Scientist", "Data analyst/scientist/engineer", "Researcher" en "Other". De gegevensset multiple_choice_responses is alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Categorische gegevens in de Tidyverse

Bekijk cursus

Oefeninstructies

  • Voeg de levels van CurrentJobTitleSelect samen tot een nieuwe variabele, grouped_titles.
  • Neem vervolgens grouped_titles en zet alles wat niet een van die drie gegroepeerde titels is in "Other Title".
  • Haal tot slot de telling op van alle gegroepeerde titels.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

multiple_choice_responses %>%
    # Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
    ___(grouped_titles = ___(CurrentJobTitleSelect, 
        "Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"), 
        "Researcher" = "Scientist/Researcher", 
        "Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist", 
                                              "Business Analyst", "Data Analyst", 
                                              "Data Miner", "Predictive Modeler"))) %>%
    # Keep all the new titles and turn every other title into "Other"
    ___(grouped_titles = ___(grouped_titles, 
                             ___ = c("Computer Scientist", 
                                     "Researcher", 
                                     "Data Analyst/Scientist/Engineer"))) %>% 
    # Get a count of the grouped titles
    ___(___)
Code bewerken en uitvoeren