CommencerCommencer gratuitement

Test de deux proportions

Vous pouvez vous demander si le montant payé pour le fret a une incidence sur le retard ou non de l'envoi. Rappelez-vous que dans l'ensemble de données late_shipments, la colonne late indique si l'envoi a été effectué en retard ou non. Les frais de transport sont enregistrés dans la colonne freight_cost_group et les catégories sont "expensive" et "reasonable".

Les hypothèses à tester, avec "late" correspondant à la proportion d'envois tardifs pour ce groupe, sont les suivantes

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats contient les estimations des proportions de la population (proportions de l'échantillon) pour chaque freight_cost_group :

freight_cost_group  late
expensive           Yes     0.082569
reasonable          Yes     0.035165
Name: late, dtype: float64

ns contient les tailles d'échantillon pour ces groupes :

freight_cost_group
expensive     545
reasonable    455
Name: late, dtype: int64

pandas et numpy ont été importés sous leurs alias habituels, et norm est disponible à partir de scipy.stats.

Cet exercice fait partie du cours

Tests d'hypothèses en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the pooled estimate of the population proportion
p_hat = ____

# Print the result
print(p_hat)
Modifier et exécuter le code