EDA sui punteggi SAT di NYC
La matematica è una materia in cui gli Stati Uniti sono costantemente indietro rispetto al resto del mondo, quindi gli esperimenti di questo capitolo si concentreranno sul punteggio di Math. Anche se il dataset originale è un open dataset scaricato da Kaggle, in questo capitolo aggiungerò alcune variabili che ti permetteranno di fare finta di essere un ricercatore in ambito educativo che conduce esperimenti pensati per aumentare i punteggi degli studenti, così da migliorare la probabilità che vengano ammessi al college.
Prima di tuffarci nell’analisi degli esperimenti, facciamo un po’ di EDA per assicurarci di comprendere a fondo i dati nyc_scores. In questa lezione svolgeremo esperimenti bloccando per Borough e Teacher_Education_Level, quindi esaminiamo i punteggi di matematica in base a queste variabili. Il dataset nyc_scores è già stato caricato per te.
Questo esercizio fa parte del corso
Progettazione Sperimentale in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Mean, var, and median of Math score
nyc_scores %>%
___(___) %>%
___(mean = ___(___, na.rm = TRUE),
var = ___(___, na.rm = TRUE),
median = ___(___, na.rm = TRUE))