LoslegenKostenlos starten

NYC-SAT-Ergebnisse: Datenvisualisierung

In der letzten Lektion haben wir bei den Latin Squares eine numerische EDA durchgeführt, indem wir uns die Mittelwerte, Varianzen und Mediane der SAT-Mathe-Ergebnisse angesehen haben. Ein weiterer wichtiger Teil der EDA ist die Datenvisualisierung: Sie hilft oft, Ausreißer zu erkennen und liefert dir eine visuelle Darstellung der Verteilung deiner Variablen.

ggplot2 ist bereits geladen und der Datensatz nyc_scores steht zur Verfügung. Erstelle und untersuche das geforderte Boxplot. Wie unterscheiden sich die Mediane zwischen den Boroughs? Wie viele Ausreißer gibt es, und wo treten sie überwiegend auf?

Diese Übung ist Teil des Kurses

<Kurs>Versuchsplanung in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle ein Boxplot der SAT-Mathe-Ergebnisse nach Borough.
  • Führe den Code mit folgendem Titel aus: "Average SAT Math Scores by Borough, NYC".
  • Ändere die Beschriftungen der x- und y-Achse mit den passenden Argumenten in labs() zu "Borough (NYC)" bzw. "Average SAT Math Scores (2014-15)".

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
  ___ + 
  labs(title = "Average SAT Math Scores by Borough, NYC",
  	   ___,
  	   ___)
Code bearbeiten und ausführen