ComenzarEmpieza gratis

Calcular medidas de dispersión

Extendamos la potente sintaxis de group_by() y summarize() a las medidas de dispersión. Si no tienes claro si trabajas con distribuciones simétricas o sesgadas, es buena idea considerar una medida robusta como el IQR además de las medidas habituales como la varianza o la desviación estándar.

Este ejercicio forma parte del curso

Análisis exploratorio de datos en R

Ver curso

Instrucciones del ejercicio

El conjunto de datos gap2007 que creaste en un ejercicio anterior está disponible en tu espacio de trabajo.

  • Para cada continente en gap2007, resume la esperanza de vida usando sd(), IQR() y el conteo de países con n(). No hace falta poner nombre a las nuevas columnas que se generen. La función n() dentro de tu llamada a summarize() no lleva argumentos.
  • Compara gráficamente la dispersión de estas distribuciones construyendo densidades superpuestas de la esperanza de vida desglosadas por continente.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Compute groupwise measures of spread
gap2007 %>%
  group_by(___) %>%
  summarize(___,
            ___,
            ___)

# Generate overlaid density plots
gap2007 %>%
  ggplot(aes(x = ___, fill = ___)) +
  geom_density(alpha = 0.3)
Editar y ejecutar código