Ausprägungen manuell zusammenfassen
In der Umfrage konnten 16 Jobtitel (einschließlich "Other") ausgewählt werden. Lass uns diese in ein paar große Kategorien zusammenfassen: "Computer Scientist", "Data analyst/scientist/engineer", "Researcher" und "Other". Der Datensatz multiple_choice_responses wurde für dich geladen.
Diese Übung ist Teil des Kurses
Kategorische Daten im Tidyverse
Anleitung zur Übung
- Fasse die Ausprägungen von
CurrentJobTitleSelectin einer neuen Variablegrouped_titleszusammen. - Nimm dann
grouped_titlesund verschiebe alles, was nicht zu diesen drei gruppierten Titeln gehört, in "Other Title". - Ermittle zum Schluss die Anzahl aller gruppierten Titel.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
multiple_choice_responses %>%
# Create new variable, grouped_titles, by collapsing levels in CurrentJobTitleSelect
___(grouped_titles = ___(CurrentJobTitleSelect,
"Computer Scientist" = c("Programmer", "Software Developer/Software Engineer"),
"Researcher" = "Scientist/Researcher",
"Data Analyst/Scientist/Engineer" = c("DBA/Database Engineer", "Data Scientist",
"Business Analyst", "Data Analyst",
"Data Miner", "Predictive Modeler"))) %>%
# Keep all the new titles and turn every other title into "Other"
___(grouped_titles = ___(grouped_titles,
___ = c("Computer Scientist",
"Researcher",
"Data Analyst/Scientist/Engineer"))) %>%
# Get a count of the grouped titles
___(___)