Test de deux proportions
Vous pouvez vous demander si le montant payé pour le fret a une incidence sur le retard ou non de l'envoi. Rappelez-vous que dans l'ensemble de données late_shipments
, la colonne late
indique si l'envoi a été effectué en retard ou non. Les frais de transport sont enregistrés dans la colonne freight_cost_group
et les catégories sont "expensive"
et "reasonable"
.
Les hypothèses à tester, avec "late"
correspondant à la proportion d'envois tardifs pour ce groupe, sont les suivantes
\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)
\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)
p_hats
contient les estimations des proportions de la population (proportions de l'échantillon) pour chaque freight_cost_group
:
freight_cost_group late
expensive Yes 0.082569
reasonable Yes 0.035165
Name: late, dtype: float64
ns
contient les tailles d'échantillon pour ces groupes :
freight_cost_group
expensive 545
reasonable 455
Name: late, dtype: int64
pandas
et numpy
ont été importés sous leurs alias habituels, et norm
est disponible à partir de scipy.stats
.
Cet exercice fait partie du cours
Tests d'hypothèses en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the pooled estimate of the population proportion
p_hat = ____
# Print the result
print(p_hat)