Calcular medidas de spread
Vamos estender a poderosa sintaxe de group_by()
e summarize()
para medidas de propagação. Se você não tiver certeza se está trabalhando com distribuições simétricas ou distorcidas, é uma boa ideia considerar uma medida robusta como IQR, além das medidas usuais de variância ou desvio padrão.
Este exercício faz parte do curso
Análise exploratória de dados em R
Instruções do exercício
O conjunto de dados gap2007
que você criou em um exercício anterior está disponível no seu espaço de trabalho.
- Para cada continente em
gap2007
, resuma as expectativas de vida usando osd()
, oIQR()
e a contagem de países,n()
. Não há necessidade de nomear as novas colunas produzidas aqui. A funçãon()
em sua chamadasummarize()
não recebe nenhum argumento. - Compare graficamente a dispersão dessas distribuições construindo gráficos de densidade sobrepostos da expectativa de vida dividida por continente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute groupwise measures of spread
gap2007 %>%
group_by(___) %>%
summarize(___,
___,
___)
# Generate overlaid density plots
gap2007 %>%
ggplot(aes(x = ___, fill = ___)) +
geom_density(alpha = 0.3)