Calcular medidas de centro
Ao longo deste capítulo, você usará dados do site gapminder, que rastreia dados demográficos em países do mundo ao longo do tempo. Para saber mais sobre isso, você pode abrir o arquivo de ajuda com ?gapminder.
Para este exercício, concentre-se em como a expectativa de vida difere de continente para continente. Isso exige que você realize sua análise não no nível do país, mas agregada até o nível do continente. Isso é possível graças à combinação de group_by() e summarize(), uma sintaxe muito avançada para realizar a mesma análise em diferentes subconjuntos do conjunto completo de dados.
Este exercício faz parte do curso
Análise exploratória de dados em R
Instruções do exercício
- Crie um conjunto de dados chamado
gap2007que contenha somente dados do ano de 2007. - Usando o site
gap2007, calcule a expectativa de vida média e mediana de cada continente. Não se preocupe em nomear as novas colunas produzidas porsummarize(). - Confirme as tendências que você vê nas medianas gerando gráficos de caixa lado a lado da expectativa de vida para cada continente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create dataset of 2007 data
gap2007 <- filter(___, ___)
# Compute groupwise mean and median lifeExp
gap2007 %>%
group_by(___) %>%
summarize(___,
___)
# Generate box plots of lifeExp for each continent
gap2007 %>%
ggplot(aes(x = ___, y = ___)) +
___