Samengevatte output filteren
In de vorige oefening heb je misschien gezien dat het land dat het minst vaak stemde, Zanzibar, in de hele gegevensset maar 2 stemmen had. Daar kun je natuurlijk geen stevige conclusies uit trekken!
In een stapsgewijze analyse stel je meestal een ondergrens in om zulke gevallen weg te filteren wanneer je merkt dat enkele observaties heel weinig data hebben terwijl andere er juist veel hebben.
Deze oefening maakt deel uit van de cursus
Casestudy: Exploratory Data Analysis in R
Oefeninstructies
Gebruik filter() om in de gesorteerde data landen te verwijderen die minder dan 100 stemmen hebben.
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Filter out countries with fewer than 100 votes
by_country %>%
arrange(percent_yes)