Aan de slagGa gratis aan de slag

Maten van het centrum berekenen

In dit hoofdstuk werk je met gegevens uit gapminder, dat in de tijd demografische gegevens van landen over de hele wereld bijhoudt. Wil je er meer over weten, open dan het helpbestand met ?gapminder.

Richt je in deze oefening op hoe de levensverwachting per continent verschilt. Je voert je analyse dus niet op landniveau uit, maar geaggregeerd op continentniveau. Dat kan dankzij de krachtige combinatie van group_by() en summarize(): hiermee voer je dezelfde analyse uit op verschillende subsets van de volledige gegevensset.

Deze oefening maakt deel uit van de cursus

Exploratory Data Analysis in R

Cursus bekijken

Oefeninstructies

  • Maak een gegevensset gap2007 met alleen de data uit 2007.
  • Bereken met gap2007 de gemiddelde en mediane levensverwachting voor elk continent. Maak je geen zorgen over het benoemen van de nieuwe kolommen die summarize() oplevert.
  • Bevestig de trends die je in de mediaan ziet door naast elkaar staande boxplots van de levensverwachting per continent te maken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create dataset of 2007 data
gap2007 <- filter(___, ___)

# Compute groupwise mean and median lifeExp
gap2007 %>%
  group_by(___) %>%
  summarize(___,
            ___)

# Generate box plots of lifeExp for each continent
gap2007 %>%
  ggplot(aes(x = ___, y = ___)) +
  ___
Code bewerken en uitvoeren