Visualizzazione dati SAT NYC
Nella lezione precedente, parlando dei quadrati latini, abbiamo fatto un'EDA numerica analizzando medie, varianze e mediane dei punteggi SAT di matematica. Un'altra parte fondamentale dell'EDA è la visualizzazione dei dati, che spesso aiuta a individuare i valori anomali e ti offre una rappresentazione visiva della distribuzione delle variabili.
ggplot2 è già stato caricato e il dataset nyc_scores è disponibile. Crea ed esamina il boxplot richiesto. Come differiscono le mediane tra i Borough? Quanti outlier sono presenti e dove si concentrano soprattutto?
Questo esercizio fa parte del corso
Progettazione Sperimentale in R
Istruzioni dell'esercizio
- Crea un boxplot dei punteggi SAT di matematica per
Borough. - Esegui il codice per includere il titolo:
"Average SAT Math Scores by Borough, NYC". - Modifica le etichette degli assi x e y in
"Borough (NYC)"e"Average SAT Math Scores (2014-15)", rispettivamente, usando gli argomenti corretti dilabs().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
___ +
labs(title = "Average SAT Math Scores by Borough, NYC",
___,
___)