Calcular medidas de dispersión
Extendamos la potente sintaxis de group_by() y summarize() a las medidas de dispersión. Si no tienes claro si trabajas con distribuciones simétricas o sesgadas, es buena idea considerar una medida robusta como el IQR además de las medidas habituales como la varianza o la desviación estándar.
Este ejercicio forma parte del curso
Análisis exploratorio de datos en R
Instrucciones del ejercicio
El conjunto de datos gap2007 que creaste en un ejercicio anterior está disponible en tu espacio de trabajo.
- Para cada continente en
gap2007, resume la esperanza de vida usandosd(),IQR()y el conteo de países conn(). No hace falta poner nombre a las nuevas columnas que se generen. La funciónn()dentro de tu llamada asummarize()no lleva argumentos. - Compara gráficamente la dispersión de estas distribuciones construyendo densidades superpuestas de la esperanza de vida desglosadas por continente.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Compute groupwise measures of spread
gap2007 %>%
group_by(___) %>%
summarize(___,
___,
___)
# Generate overlaid density plots
gap2007 %>%
ggplot(aes(x = ___, fill = ___)) +
geom_density(alpha = 0.3)