Samengevatte output filteren
In de vorige oefening heb je misschien gezien dat het land dat het minst vaak stemde, Zanzibar, in de hele gegevensset maar 2 stemmen had. Daar kun je natuurlijk geen stevige conclusies uit trekken!
In een stapsgewijze analyse stel je meestal een ondergrens in om zulke gevallen weg te filteren wanneer je merkt dat enkele observaties heel weinig data hebben terwijl andere er juist veel hebben.
Deze oefening maakt deel uit van de cursus
Casestudy: Exploratory Data Analysis in R
Oefeninstructies
Gebruik filter() om in de gesorteerde data landen te verwijderen die minder dan 100 stemmen hebben.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Filter out countries with fewer than 100 votes
by_country %>%
arrange(percent_yes)