EDA des scores SAT à NYC
Les États-Unis sont régulièrement à la traîne en mathématiques par rapport au reste du monde ; nos expériences se concentreront donc sur le score de Math. Bien que le jeu de données d’origine soit un jeu de données ouvert téléchargé depuis Kaggle, tout au long de ce chapitre, j’ajouterai quelques variables pour que vous puissiez vous mettre dans la peau d’un·e chercheur·se en éducation menant des expériences visant à améliorer les scores des élèves, afin d’augmenter leurs chances d’admission à l’université.
Avant d’analyser les expériences, faisons un peu d’EDA pour bien comprendre les données nyc_scores. Dans cette leçon, nous mènerons des expériences où nous bloquerons selon Borough et Teacher_Education_Level. Examinons donc les scores de mathématiques en fonction de ces variables. Le jeu de données nyc_scores a été chargé pour vous.
Cet exercice fait partie du cours
Plan d’expériences en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Mean, var, and median of Math score
nyc_scores %>%
___(___) %>%
___(mean = ___(___, na.rm = TRUE),
var = ___(___, na.rm = TRUE),
median = ___(___, na.rm = TRUE))