ComeçarComece de graça

Visualização de dados dos SAT de NYC

Na última lição, ao falar sobre quadrados latinos, fizemos uma EDA numérica analisando médias, variâncias e medianas das notas de SAT de matemática. Outra parte essencial da EDA é a visualização de dados, pois ela ajuda a identificar outliers e oferece uma representação visual da distribuição das variáveis.

ggplot2 já foi carregado para você e o conjunto de dados nyc_scores está disponível. Crie e analise o boxplot solicitado. Como as medianas diferem entre os boroughs? Quantos outliers estão presentes e onde eles se concentram?

Este exercício faz parte do curso

Planejamento de Experimentos em R

Ver curso

Instruções do exercício

  • Crie um boxplot das notas de SAT de Matemática por Borough.
  • Execute o código para incluir o título: "Average SAT Math Scores by Borough, NYC".
  • Altere os rótulos dos eixos x e y para "Borough (NYC)" e "Average SAT Math Scores (2014-15)", respectivamente, usando os argumentos corretos de labs().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
  ___ + 
  labs(title = "Average SAT Math Scores by Borough, NYC",
  	   ___,
  	   ___)
Editar e executar o código