Wilcoxon-Mann-Whitney
Une autre catégorie de tests d'hypothèse non paramétriques est appelée tests de somme des rangs. Les rangs sont les positions des valeurs numériques, de la plus petite à la plus grande. Considérez-les comme des positions dans des épreuves de course à pied : celui qui a le temps le plus rapide (le plus petit) est classé au rang 1, le deuxième au rang 2, et ainsi de suite.
En calculant sur les rangs des données plutôt que sur les valeurs réelles, vous pouvez éviter de faire des hypothèses sur la distribution de la statistique de test. Il est plus robuste de la même manière qu'une médiane est plus robuste qu'une moyenne.
Le test de Wilcoxon-Mann-Whitney, qui s'apparente à un test t non paramétrique, est un test commun basé sur les rangs.
late_shipments
est disponible et les paquets suivants ont été chargés : pingouin
et pandas
comme pd
.
Cet exercice fait partie du cours
Tests d'hypothèses en Python
Instructions
- Sélectionnez
weight_kilograms
etlate
à partir delate_shipments
, en leur attribuant le nomweight_vs_late
. - Convertissez
weight_vs_late
du format long au format large, en faisant passercolumns
à'late'
. - Effectuez un test de Wilcoxon-Mann-Whitney pour déterminer la différence de
weight_kilograms
lorsque l'envoi a été effectué en retard et en temps voulu.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Select the weight_kilograms and late columns
weight_vs_late = ____
# Convert weight_vs_late into wide format
weight_vs_late_wide = weight_vs_late.pivot(columns=____,
values=____)
# Run a two-sided Wilcoxon-Mann-Whitney test on weight_kilograms vs. late
wmw_test = ____
# Print the test results
print(wmw_test)