Streuungsmaße berechnen
Erweitern wir die leistungsfähige Syntax von group_by() und summarize() auf Streuungsmaße. Wenn du dir nicht sicher bist, ob du es mit symmetrischen oder schiefen Verteilungen zu tun hast, ist es sinnvoll, neben den üblichen Maßen wie Varianz oder Standardabweichung auch ein robustes Maß wie den IQR zu berücksichtigen.
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in R
Anleitung zur Übung
Der Datensatz gap2007, den du in einer früheren Übung erstellt hast, steht dir in deinem Workspace zur Verfügung.
- Fasse für jeden Kontinent in
gap2007die Lebenserwartungen mitsd(),IQR()und der Anzahl der Ländern()zusammen. Es ist nicht nötig, die dabei entstehenden neuen Spalten zu benennen. Die Funktionn()in deinemsummarize()-Aufruf benötigt keine Argumente. - Vergleiche die Streuung dieser Verteilungen grafisch, indem du überlagerte Dichteplots der Lebenserwartung nach Kontinent erstellst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compute groupwise measures of spread
gap2007 %>%
group_by(___) %>%
summarize(___,
___,
___)
# Generate overlaid density plots
gap2007 %>%
ggplot(aes(x = ___, fill = ___)) +
geom_density(alpha = 0.3)