NYC-SAT-Ergebnisse: Datenvisualisierung
In der letzten Lektion haben wir bei den Latin Squares eine numerische EDA durchgeführt, indem wir uns die Mittelwerte, Varianzen und Mediane der SAT-Mathe-Ergebnisse angesehen haben. Ein weiterer wichtiger Teil der EDA ist die Datenvisualisierung: Sie hilft oft, Ausreißer zu erkennen und liefert dir eine visuelle Darstellung der Verteilung deiner Variablen.
ggplot2 ist bereits geladen und der Datensatz nyc_scores steht zur Verfügung. Erstelle und untersuche das geforderte Boxplot. Wie unterscheiden sich die Mediane zwischen den Boroughs? Wie viele Ausreißer gibt es, und wo treten sie überwiegend auf?
Diese Übung ist Teil des Kurses
Versuchsplanung in R
Anleitung zur Übung
- Erstelle ein Boxplot der SAT-Mathe-Ergebnisse nach
Borough. - Führe den Code mit folgendem Titel aus:
"Average SAT Math Scores by Borough, NYC". - Ändere die Beschriftungen der x- und y-Achse mit den passenden Argumenten in
labs()zu"Borough (NYC)"bzw."Average SAT Math Scores (2014-15)".
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
___ +
labs(title = "Average SAT Math Scores by Borough, NYC",
___,
___)