Gruppen vergleichen
In dieser Übung wirst du Verteilungen von Daten über Gruppen hinweg vergleichen.
Der Datensatz PlantGrowth aus dem Paket datasets enthält Ergebnisse eines Experiments zu Erträgen.
Der Datensatz umfasst zwei Variablen:
group– gibt an, ob das Ergebnis aus der Kontrollgruppe oder aus einer der beiden Behandlungsgruppen stammt,weight– das Trockengewicht der Pflanzen als Maß für den Ertrag.
Erinnere dich: Mit tapply() kannst du Kennzahlen gruppenweise berechnen.
Zum Beispiel
tapply(df$x, df$grp, FUN = median)
gibt den Median von x über grp aus dem Data Frame df zurück.
Deine Aufgabe ist es, Mittelwerte zu berechnen und fünf gängige Statistiken des Ertragsgewichts zu visualisieren. Die grafische Darstellung hilft dir, Unterschiede in der Zielvariable zwischen den Gruppen zu vergleichen.
Diese Übung ist Teil des Kurses
Statistik-Interviewfragen in R üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate means across groups
tapply(___, PlantGrowth$group, FUN = ___)
# Graphically compare statistics across groups
___(___ ~ group, data = ___)