Wilcoxon-Mann-Whitney
Eine weitere Klasse nicht-parametrischer Hypothesentests sind die sogenannten Rangsummentests. Ränge sind die Positionen der Zahlenwerte vom kleinsten zum größten Wert. Stell sie dir wie Positionen in Laufwettbewerben vor: Wer die schnellste (kleinste) Zeit hat, ist auf Platz 1, der Zweitschnellste auf Platz 2 und so weiter.
Indem du mit den Rängen der Daten rechnest, anstatt mit den tatsächlichen Werten, kannst du Annahmen über die Verteilung der Teststatistik vermeiden. Er ist robuster, so wie ein Median robuster ist als ein Mittelwert.
Ein gebräuchlicher rangbasierter Test ist der Wilcoxon-Mann-Whitney-Test, der wie ein nicht-parametrischer t-Test ist.
late_shipments ist verfügbar, und die folgenden Pakete wurden geladen: pingouin und pandas als pd.
Diese Übung ist Teil des Kurses
Hypothesentests in Python
Anleitung zur Übung
- Wähle
weight_kilogramsundlateauslate_shipmentsaus und gib den Namenweight_vs_lateein. - Konvertiere
weight_vs_latevom Lang- ins Breitformat, indem ducolumnsin'late'umwandelst. - Führe einen Wilcoxon-Mann-Whitney-Test durch, um herauszufinden, ob es einen Unterschied bei
weight_kilogramsgibt, wenn die Lieferung verspätet oder pünktlich war.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Select the weight_kilograms and late columns
weight_vs_late = ____
# Convert weight_vs_late into wide format
weight_vs_late_wide = weight_vs_late.pivot(columns=____,
values=____)
# Run a two-sided Wilcoxon-Mann-Whitney test on weight_kilograms vs. late
wmw_test = ____
# Print the test results
print(wmw_test)