Die häufigsten Ausprägungen beibehalten
Manchmal möchtest du nicht nach Anteil, sondern die häufigsten n Ausprägungen beibehalten. Schau dir an, wie sich die beibehaltenen Ausprägungen für MLMethodNextYearSelect ändern, wenn wir nach Anzahl statt nach Anteil vorgehen. multiple_choice_responses wurde für dich geladen.
Diese Übung ist Teil des Kurses
Kategorische Daten im Tidyverse
Anleitung zur Übung
- Entferne Personen, die keine Methode ausgewählt haben.
- Erstelle eine neue Variable
ml_methodausMLMethodNextYearSelect, die die 5 häufigsten Bezeichnungen beibehält und den Rest mit dem Argumentother_levelals "other method" zusammenfasst. - Zähle die Häufigkeit jeder
ml_methodund sortiere absteigend.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
multiple_choice_responses %>%
# Remove NAs
filter(___) %>%
# Create ml_method, retaining the 5 most common methods and renaming others "other method"
mutate(ml_method = ___(MLMethodNextYearSelect, ___, other_level = ___)) %>%
# Count the frequency of your new variable, sorted in descending order
___(ml_method, ___)