Visualización de datos de SAT de NYC
En la lección anterior, al hablar de cuadrados latinos, hicimos un EDA numérico calculando medias, varianzas y medianas de las puntuaciones de SAT de matemáticas. Otra parte clave del EDA es la visualización de datos, ya que a menudo ayuda a detectar valores atípicos y te da una representación gráfica de la distribución de tus variables.
ggplot2 ya está cargado y el conjunto de datos nyc_scores está disponible. Crea y examina el diagrama de cajas solicitado. ¿Cómo difieren las medianas por distrito (Borough)? ¿Cuántos valores atípicos hay y dónde se concentran principalmente?
Este ejercicio forma parte del curso
Diseño experimental en R
Instrucciones del ejercicio
- Crea un diagrama de cajas de las puntuaciones de SAT de Matemáticas por
Borough. - Ejecuta el código para incluir el título:
"Average SAT Math Scores by Borough, NYC". - Cambia las etiquetas de los ejes x e y para que digan
"Borough (NYC)"y"Average SAT Math Scores (2014-15)", respectivamente, usando los argumentos correctos delabs().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
___ +
labs(title = "Average SAT Math Scores by Borough, NYC",
___,
___)