Calcular medidas de centralidade
Ao longo deste capítulo, você usará dados do gapminder, que acompanha informações demográficas de países do mundo ao longo do tempo. Para saber mais, abra a ajuda com ?gapminder.
Neste exercício, foque em como a expectativa de vida varia de continente para continente. Isso exige que você conduza sua análise não no nível do país, mas agregada no nível do continente. Isso é viabilizado pela dupla group_by() e summarize(), uma sintaxe muito poderosa para executar a mesma análise em diferentes subconjuntos do conjunto de dados completo.
Este exercício faz parte do curso
Análise Exploratória de Dados em R
Instruções do exercício
- Crie um conjunto de dados chamado
gap2007que contenha apenas dados do ano de 2007. - Usando
gap2007, calcule a média e a mediana da expectativa de vida para cada continente. Não se preocupe em nomear as novas colunas produzidas porsummarize(). - Confirme as tendências que você observar nas medianas gerando boxplots lado a lado da expectativa de vida para cada continente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create dataset of 2007 data
gap2007 <- filter(___, ___)
# Compute groupwise mean and median lifeExp
gap2007 %>%
group_by(___) %>%
summarize(___,
___)
# Generate box plots of lifeExp for each continent
gap2007 %>%
ggplot(aes(x = ___, y = ___)) +
___