ComeçarComece de graça

Gráficos de caixa para outliers

Além de indicar o centro e a dispersão de uma distribuição, um gráfico de caixa fornece um meio gráfico para detectar discrepâncias. Você pode aplicar esse método ao msrp (preço de varejo sugerido pelo fabricante) para detectar se há preços de varejo incomuns. carros caros ou baratos.

Este exercício faz parte do curso

Análise exploratória de dados em R

Ver curso

Instruções do exercício

  • Construa um gráfico de caixa de msrp.
  • Exclua os 3 a 5 maiores valores discrepantes filtrando as linhas para reter carros com menos de US$ 100.000. Salve esse conjunto de dados reduzido como cars_no_out.
  • Construa um gráfico de caixa semelhante de msrp usando esse conjunto de dados reduzido. Compare os dois gráficos.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Construct box plot of msrp
cars %>%
  ggplot(aes(x = 1, y = ___)) +
  geom_boxplot()

# Exclude outliers from data
cars_no_out <- cars %>%
  filter(___)

# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
  ___ +
  ___
Editar e executar o código