Gráficos de caixa para outliers
Além de indicar o centro e a dispersão de uma distribuição, um gráfico de caixa
fornece um meio gráfico para detectar discrepâncias. Você pode aplicar esse método ao
msrp
(preço de varejo sugerido pelo fabricante) para detectar se há preços de varejo incomuns.
carros caros ou baratos.
Este exercício faz parte do curso
Análise exploratória de dados em R
Instruções do exercício
- Construa um gráfico de caixa de
msrp
. - Exclua os 3 a 5 maiores valores discrepantes filtrando as linhas para reter carros com menos de US$ 100.000. Salve esse conjunto de dados reduzido como
cars_no_out
. - Construa um gráfico de caixa semelhante de
msrp
usando esse conjunto de dados reduzido. Compare os dois gráficos.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Construct box plot of msrp
cars %>%
ggplot(aes(x = 1, y = ___)) +
geom_boxplot()
# Exclude outliers from data
cars_no_out <- cars %>%
filter(___)
# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
___ +
___