Calcular medidas de centro
Ao longo deste capítulo, você usará dados do site gapminder
, que rastreia dados demográficos em países do mundo ao longo do tempo. Para saber mais sobre isso, você pode abrir o arquivo de ajuda com ?gapminder
.
Para este exercício, concentre-se em como a expectativa de vida difere de continente para continente. Isso exige que você realize sua análise não no nível do país, mas agregada até o nível do continente. Isso é possível graças à combinação de group_by()
e summarize()
, uma sintaxe muito avançada para realizar a mesma análise em diferentes subconjuntos do conjunto completo de dados.
Este exercício faz parte do curso
Análise exploratória de dados em R
Instruções de exercício
- Crie um conjunto de dados chamado
gap2007
que contenha somente dados do ano de 2007. - Usando o site
gap2007
, calcule a expectativa de vida média e mediana de cada continente. Não se preocupe em nomear as novas colunas produzidas porsummarize()
. - Confirme as tendências que você vê nas medianas gerando gráficos de caixa lado a lado da expectativa de vida para cada continente.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create dataset of 2007 data
gap2007 <- filter(___, ___)
# Compute groupwise mean and median lifeExp
gap2007 %>%
group_by(___) %>%
summarize(___,
___)
# Generate box plots of lifeExp for each continent
gap2007 %>%
ggplot(aes(x = ___, y = ___)) +
___