LoslegenKostenlos loslegen

Ausprägungen manuell zusammenfassen

In der Umfrage konnten 16 Jobtitel (einschließlich "Other") ausgewählt werden. Lass uns diese in ein paar große Kategorien zusammenfassen: "Computer Scientist", "Data analyst/scientist/engineer", "Researcher" und "Other". Der Datensatz multiple_choice_responses wurde für dich geladen.

Diese Übung ist Teil des Kurses

Kategorische Daten im Tidyverse

Kurs anzeigen

Anleitung zur Übung

  • Fasse die Ausprägungen von CurrentJobTitleSelect in einer neuen Variable grouped_titles zusammen.
  • Nimm dann grouped_titles und verschiebe alles, was nicht zu diesen drei gruppierten Titeln gehört, in "Other Title".
  • Ermittle zum Schluss die Anzahl aller gruppierten Titel.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

multiple_choice_responses %>%
    # Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
    ___(grouped_titles = ___(CurrentJobTitleSelect, 
        "Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"), 
        "Researcher" = "Scientist/Researcher", 
        "Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist", 
                                              "Business Analyst", "Data Analyst", 
                                              "Data Miner", "Predictive Modeler"))) %>%
    # Keep all the new titles and turn every other title into "Other"
    ___(grouped_titles = ___(grouped_titles, 
                             ___ = c("Computer Scientist", 
                                     "Researcher", 
                                     "Data Analyst/Scientist/Engineer"))) %>% 
    # Get a count of the grouped titles
    ___(___)
Code bearbeiten und ausführen