Toets voor twee proporties
Je vraagt je misschien af of de betaalde vrachtkosten invloed hebben op het feit of een zending te laat was. In de late_shipments-gegevensset staat of de zending te laat was in de kolom late. De vrachtkosten staan in de kolom freight_cost_group, met de categorieën "expensive" en "reasonable".
De te toetsen hypothesen, waarbij "late" de proportie te late zendingen voor die groep voorstelt, zijn
\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)
\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)
p_hats bevat de schattingen van populatieproporties (steekproefproporties) voor elke freight_cost_group:
freight_cost_group late
expensive Yes 0.082569
reasonable Yes 0.035165
Name: late, dtype: float64
ns bevat de steekproefgroottes voor deze groepen:
freight_cost_group
expensive 545
reasonable 455
Name: late, dtype: int64
pandas en numpy zijn geïmporteerd met hun gebruikelijke aliassen, en norm is beschikbaar vanuit scipy.stats.
Deze oefening maakt deel uit van de cursus
Hypothesetoetsen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate the pooled estimate of the population proportion
p_hat = ____
# Print the result
print(p_hat)