Aan de slagGa gratis aan de slag

Wilcoxon-Mann-Whitney

Een andere klasse van niet-parametrische hypothesetests heet rangsomtesten. Rangen zijn de posities van numerieke waarden van klein naar groot. Denk aan posities bij hardloopwedstrijden: wie de snelste (kleinste) tijd heeft, is rang 1, de tweede snelste is rang 2, enzovoort.

Door te rekenen met de rangen van de gegevens in plaats van de werkelijke waarden, hoef je geen aannames te doen over de verdeling van de teststatistiek. Het is robuuster, net zoals de mediaan robuuster is dan het gemiddelde.

Een veelgebruikte ranggebaseerde test is de Wilcoxon-Mann-Whitney-test, die lijkt op een niet-parametrische t-test.

late_shipments is beschikbaar, en de volgende pakketten zijn geladen: pingouin en pandas als pd.

Deze oefening maakt deel uit van de cursus

Hypothesetoetsen in Python

Cursus bekijken

Oefeninstructies

  • Selecteer weight_kilograms en late uit late_shipments, en geef het de naam weight_vs_late.
  • Zet weight_vs_late om van long- naar wide-formaat, met columns ingesteld op 'late'.
  • Voer een Wilcoxon-Mann-Whitney-test uit voor een verschil in weight_kilograms wanneer de zending te laat was en op tijd.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Select the weight_kilograms and late columns
weight_vs_late = ____

# Convert weight_vs_late into wide format
weight_vs_late_wide = weight_vs_late.pivot(columns=____, 
                                           values=____)


# Run a two-sided Wilcoxon-Mann-Whitney test on weight_kilograms vs. late
wmw_test = ____



# Print the test results
print(wmw_test)
Code bewerken en uitvoeren