NYC SAT-scores visualiseren
In de vorige les, bij het bespreken van Latijnse vierkanten, deden we numerieke EDA door naar gemiddelden, varianties en medianen van de SAT-scores voor wiskunde te kijken. Een ander cruciaal onderdeel van EDA is datavisualisatie, omdat het vaak helpt om uitschieters te spotten en je een visuele weergave geeft van de verdeling van je variabelen.
ggplot2 is voor je geladen en de nyc_scores-gegevensset is beschikbaar. Maak en bekijk de gevraagde boxplot. Hoe verschillen de medianen per borough? Hoeveel uitschieters zijn er, en waar komen ze vooral voor?
Deze oefening maakt deel uit van de cursus
Experimenteel ontwerp in R
Oefeninstructies
- Maak een boxplot van SAT-scores voor wiskunde per
Borough. - Voer de code uit om deze titel toe te voegen:
"Average SAT Math Scores by Borough, NYC". - Verander de x- en y-aslabels naar respectievelijk
"Borough (NYC)"en"Average SAT Math Scores (2014-15)", met de juiste argumenten inlabs().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
___ +
labs(title = "Average SAT Math Scores by Borough, NYC",
___,
___)