Aan de slagGa gratis aan de slag

De meest voorkomende niveaus behouden

Soms wil je niveaus niet op basis van proportie behouden, maar juist de meest voorkomende n niveaus. Laten we kijken hoe de behouden niveaus voor MLMethodNextYearSelect veranderen wanneer we op aantal in plaats van proportie selecteren. multiple_choice_responses is alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Categorische gegevens in de Tidyverse

Cursus bekijken

Oefeninstructies

  • Verwijder mensen die geen methode hebben geselecteerd.
  • Maak een nieuwe variabele, ml_method, op basis van MLMethodNextYearSelect die de 5 meest voorkomende titels behoudt en de rest samenvoegt als "other method" met behulp van het argument other_level.
  • Tel hoe vaak elke ml_method voorkomt en sorteer aflopend.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

multiple_choice_responses %>%
  # Remove NAs 
  filter(___) %>%
  # Create ml_method, retaining the 5 most common methods and renaming others "other method" 
  mutate(ml_method = ___(MLMethodNextYearSelect, ___, other_level = ___)) %>%
  # Count the frequency of your new variable, sorted in descending order
  ___(ml_method, ___)
Code bewerken en uitvoeren