Viele Kategorien visualisieren
Bisher haben wir in diesem Kapitel nur den Fall betrachtet, dass es bei einer numerischen Variable Unterschiede zwischen zwei Kategorien gibt. Natürlich enthalten viele Datensätze mehr Kategorien. Bevor du Tests für viele Kategorien durchführst, ist es oft hilfreich, eine explorative Datenanalyse durchzuführen. Das heißt, du berechnest zusammenfassende Statistiken für jede Gruppe und visualisierst die Verteilungen der numerischen Variablen für jede Kategorie mithilfe von Boxplots.
An dieser Stelle kehren wir zu den Daten über verspätete Sendungen zurück und zeigen, wie der Preis für jedes Paket (pack_price
) zwischen den drei Versandarten (shipment_mode
) variiert: "Air"
, "Air Charter"
, und "Ocean"
.
late_shipments
ist verfügbar; dplyr
und ggplot2
sind geladen.
Diese Übung ist Teil des Kurses
Hypothesentests in R
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Using late_shipments, group by shipment mode, and calculate the mean and std dev of pack price
___