ComenzarEmpieza gratis

Visualización de datos de SAT de NYC

En la lección anterior, al hablar de cuadrados latinos, hicimos un EDA numérico calculando medias, varianzas y medianas de las puntuaciones de SAT de matemáticas. Otra parte clave del EDA es la visualización de datos, ya que a menudo ayuda a detectar valores atípicos y te da una representación gráfica de la distribución de tus variables.

ggplot2 ya está cargado y el conjunto de datos nyc_scores está disponible. Crea y examina el diagrama de cajas solicitado. ¿Cómo difieren las medianas por distrito (Borough)? ¿Cuántos valores atípicos hay y dónde se concentran principalmente?

Este ejercicio forma parte del curso

Diseño experimental en R

Ver curso

Instrucciones del ejercicio

  • Crea un diagrama de cajas de las puntuaciones de SAT de Matemáticas por Borough.
  • Ejecuta el código para incluir el título: "Average SAT Math Scores by Borough, NYC".
  • Cambia las etiquetas de los ejes x e y para que digan "Borough (NYC)" y "Average SAT Math Scores (2014-15)", respectivamente, usando los argumentos correctos de labs().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
  ___ + 
  labs(title = "Average SAT Math Scores by Borough, NYC",
  	   ___,
  	   ___)
Editar y ejecutar código