ComenzarEmpieza gratis

Identificar valores atípicos

Observa la distribución, mostrada aquí, de las esperanzas de vida de los países de Asia. El diagrama de caja identifica un claro valor atípico: un país con una esperanza de vida notablemente baja. ¿Te imaginas qué país podría ser? Pon a prueba tu hipótesis en la consola usando min() o filter(), y luego continúa creando una visualización con ese país eliminado.

Este ejercicio forma parte del curso

Análisis exploratorio de datos en R

Ver curso

Instrucciones del ejercicio

gap2007 sigue disponible en tu espacio de trabajo.

  • Aplica un filtro para que solo contenga observaciones de Asia, y luego crea una nueva variable llamada is_outlier que sea TRUE para los países con esperanza de vida menor que 50. Asigna el resultado a gap_asia.
  • Filtra gap_asia para eliminar todos los valores atípicos y, después, crea otro diagrama de caja con las esperanzas de vida restantes.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Filter for Asia, add column indicating outliers
gap_asia <- ___ %>%
  filter(___) %>%
  mutate(___ = ___)

# Remove outliers, create box plot of lifeExp
gap_asia %>%
  filter(___) %>%
  ggplot(aes(x = ___, y = ___)) +
  ___
Editar y ejecutar código