EmpezarEmpieza gratis

Identificar valores atípicos

Observa la distribución, mostrada aquí, de las esperanzas de vida de los países de Asia. El diagrama de caja identifica un claro valor atípico: un país con una esperanza de vida notablemente baja. ¿Te imaginas qué país podría ser? Pon a prueba tu hipótesis en la consola usando min() o filter(), y luego continúa creando una visualización con ese país eliminado.

Este ejercicio forma parte del curso

Análisis exploratorio de datos en R

Ver curso

Instrucciones del ejercicio

gap2007 sigue disponible en tu espacio de trabajo.

  • Aplica un filtro para que solo contenga observaciones de Asia, y luego crea una nueva variable llamada is_outlier que sea TRUE para los países con esperanza de vida menor que 50. Asigna el resultado a gap_asia.
  • Filtra gap_asia para eliminar todos los valores atípicos y, después, crea otro diagrama de caja con las esperanzas de vida restantes.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Filter for Asia, add column indicating outliers
gap_asia <- ___ %>%
  filter(___) %>%
  mutate(___ = ___)

# Remove outliers, create box plot of lifeExp
gap_asia %>%
  filter(___) %>%
  ggplot(aes(x = ___, y = ___)) +
  ___
Editar y ejecutar código