ComeçarComece gratuitamente

Calcular medidas de centro

Ao longo deste capítulo, você usará dados do site gapminder, que rastreia dados demográficos em países do mundo ao longo do tempo. Para saber mais sobre isso, você pode abrir o arquivo de ajuda com ?gapminder.

Para este exercício, concentre-se em como a expectativa de vida difere de continente para continente. Isso exige que você realize sua análise não no nível do país, mas agregada até o nível do continente. Isso é possível graças à combinação de group_by() e summarize(), uma sintaxe muito avançada para realizar a mesma análise em diferentes subconjuntos do conjunto completo de dados.

Este exercício faz parte do curso

Análise exploratória de dados em R

Ver Curso

Instruções de exercício

  • Crie um conjunto de dados chamado gap2007 que contenha somente dados do ano de 2007.
  • Usando o site gap2007, calcule a expectativa de vida média e mediana de cada continente. Não se preocupe em nomear as novas colunas produzidas por summarize().
  • Confirme as tendências que você vê nas medianas gerando gráficos de caixa lado a lado da expectativa de vida para cada continente.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Create dataset of 2007 data
gap2007 <- filter(___, ___)

# Compute groupwise mean and median lifeExp
gap2007 %>%
  group_by(___) %>%
  summarize(___,
            ___)

# Generate box plots of lifeExp for each continent
gap2007 %>%
  ggplot(aes(x = ___, y = ___)) +
  ___
Editar e executar código