ComeçarComece de graça

Calcular medidas de dispersão

Vamos estender a poderosa sintaxe de group_by() e summarize() para incluir medidas de dispersão. Se você não tem certeza se está lidando com distribuições simétricas ou assimétricas, é uma boa prática considerar uma medida robusta como o IQR, além das medidas usuais de variância ou desvio padrão.

Este exercício faz parte do curso

Análise Exploratória de Dados em R

Ver curso

Instruções do exercício

O conjunto de dados gap2007 que você criou em um exercício anterior está disponível no seu workspace.

  • Para cada continente em gap2007, resuma as expectativas de vida usando sd(), IQR() e a contagem de países, n(). Não é necessário nomear as novas colunas geradas aqui. A função n() dentro da sua chamada summarize() não recebe argumentos.
  • Compare graficamente a dispersão dessas distribuições construindo gráficos de densidade sobrepostos da expectativa de vida, separados por continente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Compute groupwise measures of spread
gap2007 %>%
  group_by(___) %>%
  summarize(___,
            ___,
            ___)

# Generate overlaid density plots
gap2007 %>%
  ggplot(aes(x = ___, fill = ___)) +
  geom_density(alpha = 0.3)
Editar e executar o código