Calcular medidas de dispersão
Vamos estender a poderosa sintaxe de group_by() e summarize() para incluir medidas de dispersão. Se você não tem certeza se está lidando com distribuições simétricas ou assimétricas, é uma boa prática considerar uma medida robusta como o IQR, além das medidas usuais de variância ou desvio padrão.
Este exercício faz parte do curso
Análise Exploratória de Dados em R
Instruções do exercício
O conjunto de dados gap2007 que você criou em um exercício anterior está disponível no seu workspace.
- Para cada continente em
gap2007, resuma as expectativas de vida usandosd(),IQR()e a contagem de países,n(). Não é necessário nomear as novas colunas geradas aqui. A funçãon()dentro da sua chamadasummarize()não recebe argumentos. - Compare graficamente a dispersão dessas distribuições construindo gráficos de densidade sobrepostos da expectativa de vida, separados por continente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute groupwise measures of spread
gap2007 %>%
group_by(___) %>%
summarize(___,
___,
___)
# Generate overlaid density plots
gap2007 %>%
ggplot(aes(x = ___, fill = ___)) +
geom_density(alpha = 0.3)