Wilcoxon-Mann-Whitney
Eine weitere Klasse nicht-parametrischer Hypothesentests sind die sogenannten Rangsummentests. Ränge sind die Positionen der Zahlenwerte vom kleinsten zum größten Wert. Stell sie dir wie Positionen in Laufwettbewerben vor: Wer die schnellste (kleinste) Zeit hat, ist auf Platz 1, der Zweitschnellste auf Platz 2 und so weiter.
Indem du mit den Rängen der Daten rechnest, anstatt mit den tatsächlichen Werten, kannst du Annahmen über die Verteilung der Teststatistik vermeiden. Er ist robuster, so wie ein Median robuster ist als ein Mittelwert.
Ein gebräuchlicher rangbasierter Test ist der Wilcoxon-Mann-Whitney-Test, der wie ein nicht-parametrischer t-Test ist.
late_shipments
ist verfügbar, und die folgenden Pakete wurden geladen: pingouin
und pandas
als pd
.
Diese Übung ist Teil des Kurses
Hypothesentests in Python
Anleitung zur Übung
- Wähle
weight_kilograms
undlate
auslate_shipments
aus und gib den Namenweight_vs_late
ein. - Konvertiere
weight_vs_late
vom Lang- ins Breitformat, indem ducolumns
in'late'
umwandelst. - Führe einen Wilcoxon-Mann-Whitney-Test durch, um herauszufinden, ob es einen Unterschied bei
weight_kilograms
gibt, wenn die Lieferung verspätet oder pünktlich war.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Select the weight_kilograms and late columns
weight_vs_late = ____
# Convert weight_vs_late into wide format
weight_vs_late_wide = weight_vs_late.pivot(columns=____,
values=____)
# Run a two-sided Wilcoxon-Mann-Whitney test on weight_kilograms vs. late
wmw_test = ____
# Print the test results
print(wmw_test)