CommencerCommencer gratuitement

Wilcoxon-Mann-Whitney

Une autre catégorie de tests d'hypothèse non paramétriques est appelée tests de somme des rangs. Les rangs sont les positions des valeurs numériques, de la plus petite à la plus grande. Considérez-les comme des positions dans des épreuves de course à pied : celui qui a le temps le plus rapide (le plus petit) est classé au rang 1, le deuxième au rang 2, et ainsi de suite.

En calculant sur les rangs des données plutôt que sur les valeurs réelles, vous pouvez éviter de faire des hypothèses sur la distribution de la statistique de test. Il est plus robuste de la même manière qu'une médiane est plus robuste qu'une moyenne.

Le test de Wilcoxon-Mann-Whitney, qui s'apparente à un test t non paramétrique, est un test commun basé sur les rangs.

late_shipments est disponible et les paquets suivants ont été chargés : pingouin et pandas comme pd.

Cet exercice fait partie du cours

Tests d'hypothèses en Python

Afficher le cours

Instructions

  • Sélectionnez weight_kilograms et late à partir de late_shipments, en leur attribuant le nom weight_vs_late.
  • Convertissez weight_vs_late du format long au format large, en faisant passer columns à 'late'.
  • Effectuez un test de Wilcoxon-Mann-Whitney pour déterminer la différence de weight_kilograms lorsque l'envoi a été effectué en retard et en temps voulu.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Select the weight_kilograms and late columns
weight_vs_late = ____

# Convert weight_vs_late into wide format
weight_vs_late_wide = weight_vs_late.pivot(columns=____, 
                                           values=____)


# Run a two-sided Wilcoxon-Mann-Whitney test on weight_kilograms vs. late
wmw_test = ____



# Print the test results
print(wmw_test)
Modifier et exécuter le code