Aan de slagGa gratis aan de slag

Niveaus verwijderen

De kruistabel uit de vorige oefening liet zien dat sommige niveaus heel lage aantallen hebben. Om de analyse te vereenvoudigen, helpt het vaak om zulke niveaus te verwijderen.

In R zijn daar twee stappen voor nodig: eerst filter je alle rijen weg met de niveaus die heel lage aantallen hebben, daarna verwijder je deze niveaus uit de factorvariabele met droplevels(). Dit komt doordat de functie droplevels() niveaus met slechts 1 of 2 voorkomens behoudt; hij verwijdert alleen niveaus die niet in een gegevensset voorkomen.

Deze oefening maakt deel uit van de cursus

Exploratory Data Analysis in R

Cursus bekijken

Oefeninstructies

De kruistabel uit de vorige oefening staat in je workspace als tab.

  • Laad het pakket dplyr.
  • Print tab om te zien welk niveau van align de minste totale vermeldingen heeft.
  • Gebruik filter() om alle rijen van comics met dat niveau weg te filteren en verwijder daarna het ongebruikte niveau met droplevels(). Sla de vereenvoudigde gegevensset op als comics_filtered.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load dplyr
___

# Print tab
___

# Remove align level
comics_filtered <- ___ %>%
  ___(align != ___) %>%
  ___()

# See the result
comics_filtered
Code bewerken en uitvoeren