Diagramas de caja para valores atípicos
Además de indicar el centro y la dispersión de una distribución, un diagrama de caja ofrece una forma gráfica de detectar valores atípicos. Puedes aplicar este método a la columna msrp (precio de venta sugerido por el fabricante) para detectar si hay coches inusualmente caros o baratos.
Este ejercicio forma parte del curso
Análisis exploratorio de datos en R
Instrucciones del ejercicio
- Construye un diagrama de caja de
msrp. - Excluye los 3-5 valores atípicos más grandes filtrando las filas para quedarte con coches de menos de $100,000. Guarda este conjunto de datos reducido como
cars_no_out. - Construye un diagrama de caja similar de
msrpusando este conjunto de datos reducido. Compara ambas gráficas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Construct box plot of msrp
cars %>%
ggplot(aes(x = 1, y = ___)) +
geom_boxplot()
# Exclude outliers from data
cars_no_out <- cars %>%
filter(___)
# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
___ +
___