Identificar valores atípicos
Observa la distribución, mostrada aquí, de las esperanzas de vida de los países de Asia. El diagrama de caja identifica un claro valor atípico: un país con una esperanza de vida notablemente baja. ¿Te imaginas qué país podría ser? Pon a prueba tu hipótesis en la consola usando min() o filter(), y luego continúa creando una visualización con ese país eliminado.
Este ejercicio forma parte del curso
Análisis exploratorio de datos en R
Instrucciones del ejercicio
gap2007 sigue disponible en tu espacio de trabajo.
- Aplica un filtro para que solo contenga observaciones de Asia, y luego crea una nueva variable llamada
is_outlierque seaTRUEpara los países con esperanza de vida menor que 50. Asigna el resultado agap_asia. - Filtra
gap_asiapara eliminar todos los valores atípicos y, después, crea otro diagrama de caja con las esperanzas de vida restantes.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Filter for Asia, add column indicating outliers
gap_asia <- ___ %>%
filter(___) %>%
mutate(___ = ___)
# Remove outliers, create box plot of lifeExp
gap_asia %>%
filter(___) %>%
ggplot(aes(x = ___, y = ___)) +
___