Maten van het centrum berekenen
In dit hoofdstuk werk je met gegevens uit gapminder, dat in de tijd demografische gegevens van landen over de hele wereld bijhoudt. Wil je er meer over weten, open dan het helpbestand met ?gapminder.
Richt je in deze oefening op hoe de levensverwachting per continent verschilt. Je voert je analyse dus niet op landniveau uit, maar geaggregeerd op continentniveau. Dat kan dankzij de krachtige combinatie van group_by() en summarize(): hiermee voer je dezelfde analyse uit op verschillende subsets van de volledige gegevensset.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in R
Oefeninstructies
- Maak een gegevensset
gap2007met alleen de data uit 2007. - Bereken met
gap2007de gemiddelde en mediane levensverwachting voor elk continent. Maak je geen zorgen over het benoemen van de nieuwe kolommen diesummarize()oplevert. - Bevestig de trends die je in de mediaan ziet door naast elkaar staande boxplots van de levensverwachting per continent te maken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create dataset of 2007 data
gap2007 <- filter(___, ___)
# Compute groupwise mean and median lifeExp
gap2007 %>%
group_by(___) %>%
summarize(___,
___)
# Generate box plots of lifeExp for each continent
gap2007 %>%
ggplot(aes(x = ___, y = ___)) +
___