Box plots para outliers
Além de indicar o centro e a dispersão de uma distribuição, um box plot oferece uma forma gráfica de detectar outliers. Você pode aplicar esse método à coluna msrp (preço sugerido pelo fabricante) para verificar se há carros incomumente caros ou baratos.
Este exercício faz parte do curso
Análise Exploratória de Dados em R
Instruções do exercício
- Construa um box plot de
msrp. - Exclua os 3–5 maiores outliers filtrando as linhas para manter carros com menos de US$ 100.000. Salve esse conjunto de dados reduzido como
cars_no_out. - Construa um box plot semelhante de
msrpusando esse conjunto de dados reduzido. Compare os dois gráficos.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Construct box plot of msrp
cars %>%
ggplot(aes(x = 1, y = ___)) +
geom_boxplot()
# Exclude outliers from data
cars_no_out <- cars %>%
filter(___)
# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
___ +
___