Lagemaße berechnen
In diesem Kapitel arbeitest du mit Daten aus gapminder, das demografische Daten von Ländern der Welt über die Zeit hinweg erfasst. Mehr dazu findest du in der Hilfe mit ?gapminder.
In dieser Übung schaust du dir an, wie sich die Lebenserwartung zwischen den Kontinenten unterscheidet. Dafür führst du die Analyse nicht auf Länderebene durch, sondern aggregiert auf Kontinentebene. Das gelingt mit der starken Kombination aus group_by() und summarize(): eine sehr mächtige Syntax, um dieselbe Analyse auf verschiedene Teilmengen des gesamten Datensatzes anzuwenden.
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in R
Anleitung zur Übung
- Erstelle einen Datensatz namens
gap2007, der nur Daten aus dem Jahr 2007 enthält. - Berechne mit
gap2007die durchschnittliche und die mediane Lebenserwartung für jeden Kontinent. Mach dir keine Sorgen um die Benennung der neuen Spalten, diesummarize()erzeugt. - Bestätige die Trends, die du in den Medians siehst, indem du nebeneinanderliegende Boxplots der Lebenserwartung für jeden Kontinent erstellst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create dataset of 2007 data
gap2007 <- filter(___, ___)
# Compute groupwise mean and median lifeExp
gap2007 %>%
group_by(___) %>%
summarize(___,
___)
# Generate box plots of lifeExp for each continent
gap2007 %>%
ggplot(aes(x = ___, y = ___)) +
___