Faktorielles EDA zu NYC-SAT-Ergebnissen
Lass uns noch etwas EDA machen, bevor wir in die Analyse unseres faktoriellen Experiments einsteigen.
Wir testen den Einfluss von Percent_Black_HL, Percent_Tested_HL und Tutoring_Program auf das Ergebnis Average_Score_SAT_Math. HL steht für High-Low: 1 bedeutet jeweils, dass weniger als 50 % der Black-Schülerinnen und -Schüler oder dass weniger als 50 % aller Schülerinnen und Schüler an einer Schule getestet wurden; 2 bedeutet, dass mehr als 50 % der jeweiligen Gruppe getestet wurden.
Erstelle für jeden Faktor im Vergleich zum Outcome ein Boxplot, um ein Gefühl dafür zu bekommen, bei welchen sich die Medianwerte je Faktorstufe unterscheiden (letztlich wird der Mittelwertunterschied getestet). Der Datensatz nyc_scores ist bereits für dich geladen.
Diese Übung ist Teil des Kurses
Versuchsplanung in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load ggplot2
___
# Build the boxplot for the tutoring program vs. Math SAT score
ggplot(___,
aes(___, ___)) +
geom_boxplot()