ComenzarEmpieza gratis

Diagramas de caja para valores atípicos

Además de indicar el centro y la dispersión de una distribución, un diagrama de caja ofrece una forma gráfica de detectar valores atípicos. Puedes aplicar este método a la columna msrp (precio de venta sugerido por el fabricante) para detectar si hay coches inusualmente caros o baratos.

Este ejercicio forma parte del curso

Análisis exploratorio de datos en R

Ver curso

Instrucciones del ejercicio

  • Construye un diagrama de caja de msrp.
  • Excluye los 3-5 valores atípicos más grandes filtrando las filas para quedarte con coches de menos de $100,000. Guarda este conjunto de datos reducido como cars_no_out.
  • Construye un diagrama de caja similar de msrp usando este conjunto de datos reducido. Compara ambas gráficas.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Construct box plot of msrp
cars %>%
  ggplot(aes(x = 1, y = ___)) +
  geom_boxplot()

# Exclude outliers from data
cars_no_out <- cars %>%
  filter(___)

# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
  ___ +
  ___
Editar y ejecutar código