Wilcoxon-Mann-Whitney
Een andere klasse van niet-parametrische hypothesetests heet rangsomtesten. Rangen zijn de posities van numerieke waarden van klein naar groot. Denk aan posities bij hardloopwedstrijden: wie de snelste (kleinste) tijd heeft, is rang 1, de tweede snelste is rang 2, enzovoort.
Door te rekenen met de rangen van de gegevens in plaats van de werkelijke waarden, hoef je geen aannames te doen over de verdeling van de teststatistiek. Het is robuuster, net zoals de mediaan robuuster is dan het gemiddelde.
Een veelgebruikte ranggebaseerde test is de Wilcoxon-Mann-Whitney-test, die lijkt op een niet-parametrische t-test.
late_shipments is beschikbaar, en de volgende pakketten zijn geladen: pingouin en pandas als pd.
Deze oefening maakt deel uit van de cursus
Hypothesetoetsen in Python
Oefeninstructies
- Selecteer
weight_kilogramsenlateuitlate_shipments, en geef het de naamweight_vs_late. - Zet
weight_vs_lateom van long- naar wide-formaat, metcolumnsingesteld op'late'. - Voer een Wilcoxon-Mann-Whitney-test uit voor een verschil in
weight_kilogramswanneer de zending te laat was en op tijd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Select the weight_kilograms and late columns
weight_vs_late = ____
# Convert weight_vs_late into wide format
weight_vs_late_wide = weight_vs_late.pivot(columns=____,
values=____)
# Run a two-sided Wilcoxon-Mann-Whitney test on weight_kilograms vs. late
wmw_test = ____
# Print the test results
print(wmw_test)