IniziaInizia gratis

Visualizzazione dati SAT NYC

Nella lezione precedente, parlando dei quadrati latini, abbiamo fatto un'EDA numerica analizzando medie, varianze e mediane dei punteggi SAT di matematica. Un'altra parte fondamentale dell'EDA è la visualizzazione dei dati, che spesso aiuta a individuare i valori anomali e ti offre una rappresentazione visiva della distribuzione delle variabili.

ggplot2 è già stato caricato e il dataset nyc_scores è disponibile. Crea ed esamina il boxplot richiesto. Come differiscono le mediane tra i Borough? Quanti outlier sono presenti e dove si concentrano soprattutto?

Questo esercizio fa parte del corso

Progettazione Sperimentale in R

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un boxplot dei punteggi SAT di matematica per Borough.
  • Esegui il codice per includere il titolo: "Average SAT Math Scores by Borough, NYC".
  • Modifica le etichette degli assi x e y in "Borough (NYC)" e "Average SAT Math Scores (2014-15)", rispettivamente, usando gli argomenti corretti di labs().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
  ___ + 
  labs(title = "Average SAT Math Scores by Borough, NYC",
  	   ___,
  	   ___)
Modifica ed esegui il codice