Calcul d'un score z
Comme les variables ont des plages et des unités arbitraires, nous devons les normaliser. Par exemple, un test d'hypothèse qui donnerait des réponses différentes si les variables étaient exprimées en euros plutôt qu'en dollars (US) n'aurait que peu de valeur. La normalisation permet d'éviter cela.
Une valeur standardisée intéressante dans un test d'hypothèse s'appelle le score z. Pour la calculer, vous avez besoin de trois nombres : la statistique de l'échantillon (estimation ponctuelle), la statistique hypothétique et l'erreur standard de la statistique (estimée à partir de la distribution Bootstrap).
La statistique de l'échantillon est disponible en tant que late_prop_samp
.
late_shipments_boot_distn
est une distribution Bootstrap de la proportion d'envois tardifs, disponible sous forme de liste.
pandas
et numpy
sont chargés avec leurs alias habituels.
Cet exercice fait partie du cours
Tests d'hypothèses en Python
Instructions
- Faites l'hypothèse que la proportion d'envois tardifs est de 6 %.
- Calculez l'erreur standard à partir de l'écart-type de la distribution Bootstrap.
- Calculez le score z.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Hypothesize that the proportion is 6%
late_prop_hyp = ____
# Calculate the standard error
std_error = ____
# Find z-score of late_prop_samp
z_score = ____
# Print z_score
print(z_score)