EDA factorial de las puntuaciones SAT de NYC
Hagamos un poco más de EDA antes de meternos en el análisis de nuestro experimento factorial.
Probemos el efecto de Percent_Black_HL, Percent_Tested_HL y Tutoring_Program sobre el resultado, Average_Score_SAT_Math. HL significa high-low: un 1 indica, respectivamente, que menos del 50% de estudiantes Black o que menos del 50% de todos los estudiantes de un centro hicieron la prueba; un 2 indica que más del 50% de cualquiera de los dos grupos la hicieron.
Crea un diagrama de cajas de cada factor frente al resultado para hacerte una idea de cuáles muestran diferencia en la mediana por nivel del factor (al final, lo que se contrasta es la diferencia de medias). El conjunto de datos nyc_scores ya está cargado para ti.
Este ejercicio forma parte del curso
Diseño experimental en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load ggplot2
___
# Build the boxplot for the tutoring program vs. Math SAT score
ggplot(___,
aes(___, ___)) +
geom_boxplot()