CommencerCommencer gratuitement

EDA factorielle des scores SAT à NYC

Faisons encore un peu d’exploration avant d’attaquer l’analyse de notre expérience factorielle.

Testons l’effet de Percent_Black_HL, Percent_Tested_HL et Tutoring_Program sur la variable cible Average_Score_SAT_Math. HL signifie high-low : 1 indique respectivement que moins de 50 % des élèves Noirs ou que moins de 50 % de l’ensemble des élèves d’un établissement ont été testés, et 2 indique que plus de 50 % l’ont été dans l’un ou l’autre cas.

Créez un boxplot de chaque facteur par rapport à la cible pour repérer ceux qui présentent une différence de médiane selon le niveau du facteur (in fine, c’est la différence de moyenne qui est testée). Le jeu de données nyc_scores a été chargé pour vous.

Cet exercice fait partie du cours

Plan d’expériences en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load ggplot2
___

# Build the boxplot for the tutoring program vs. Math SAT score
ggplot(___,
       aes(___, ___)) + 
    geom_boxplot()
Modifier et exécuter le code