Visualização de dados dos SAT de NYC
Na última lição, ao falar sobre quadrados latinos, fizemos uma EDA numérica analisando médias, variâncias e medianas das notas de SAT de matemática. Outra parte essencial da EDA é a visualização de dados, pois ela ajuda a identificar outliers e oferece uma representação visual da distribuição das variáveis.
ggplot2 já foi carregado para você e o conjunto de dados nyc_scores está disponível. Crie e analise o boxplot solicitado. Como as medianas diferem entre os boroughs? Quantos outliers estão presentes e onde eles se concentram?
Este exercício faz parte do curso
Planejamento de Experimentos em R
Instruções do exercício
- Crie um boxplot das notas de SAT de Matemática por
Borough. - Execute o código para incluir o título:
"Average SAT Math Scores by Borough, NYC". - Altere os rótulos dos eixos x e y para
"Borough (NYC)"e"Average SAT Math Scores (2014-15)", respectivamente, usando os argumentos corretos delabs().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
___ +
labs(title = "Average SAT Math Scores by Borough, NYC",
___,
___)