Aan de slagGa gratis aan de slag

Toets voor twee proporties

Je vraagt je misschien af of de betaalde vrachtkosten invloed hebben op het feit of een zending te laat was. In de late_shipments-gegevensset staat of de zending te laat was in de kolom late. De vrachtkosten staan in de kolom freight_cost_group, met de categorieën "expensive" en "reasonable".

De te toetsen hypothesen, waarbij "late" de proportie te late zendingen voor die groep voorstelt, zijn

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats bevat de schattingen van populatieproporties (steekproefproporties) voor elke freight_cost_group:

freight_cost_group  late
expensive           Yes     0.082569
reasonable          Yes     0.035165
Name: late, dtype: float64

ns bevat de steekproefgroottes voor deze groepen:

freight_cost_group
expensive     545
reasonable    455
Name: late, dtype: int64

pandas en numpy zijn geïmporteerd met hun gebruikelijke aliassen, en norm is beschikbaar vanuit scipy.stats.

Deze oefening maakt deel uit van de cursus

Hypothesetoetsen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate the pooled estimate of the population proportion
p_hat = ____

# Print the result
print(p_hat)
Code bewerken en uitvoeren