Niveaus verwijderen
De kruistabel uit de vorige oefening liet zien dat sommige niveaus heel lage aantallen hebben. Om de analyse te vereenvoudigen, helpt het vaak om zulke niveaus te verwijderen.
In R zijn daar twee stappen voor nodig: eerst filter je alle rijen weg met de niveaus die heel lage aantallen hebben, daarna verwijder je deze niveaus uit de factorvariabele met droplevels(). Dit komt doordat de functie droplevels() niveaus met slechts 1 of 2 voorkomens behoudt; hij verwijdert alleen niveaus die niet in een gegevensset voorkomen.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in R
Oefeninstructies
De kruistabel uit de vorige oefening staat in je workspace als tab.
- Laad het pakket
dplyr. - Print
tabom te zien welk niveau vanalignde minste totale vermeldingen heeft. - Gebruik
filter()om alle rijen vancomicsmet dat niveau weg te filteren en verwijder daarna het ongebruikte niveau metdroplevels(). Sla de vereenvoudigde gegevensset op alscomics_filtered.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load dplyr
___
# Print tab
___
# Remove align level
comics_filtered <- ___ %>%
___(align != ___) %>%
___()
# See the result
comics_filtered