LoslegenKostenlos loslegen

Test von zwei Proportionen

Du fragst dich vielleicht, ob der für die Fracht gezahlte Betrag Einfluss darauf hat, ob die Sendung verspätet war oder nicht. Erinnere dich daran, dass im Datensatz late_shipments in der Spalte late gespeichert ist, ob die Sendung verspätet war oder nicht. Die Frachtkosten werden in der Spalte freight_cost_group gespeichert, und die Kategorien sind "expensive" und "reasonable".

Die zu testenden Hypothesen, wobei "late" dem Anteil der verspäteten Sendungen für diese Gruppe entspricht, sind

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats enthält die Schätzungen der Grundgesamtheitsanteile (Stichprobenanteile) für jede freight_cost_group:

freight_cost_group  late
expensive           Yes     0.082569
reasonable          Yes     0.035165
Name: late, dtype: float64

ns enthält die Stichprobengrößen für diese Gruppen:

freight_cost_group
expensive     545
reasonable    455
Name: late, dtype: int64

pandas und numpy wurden unter ihren üblichen Aliasnamen importiert, und norm ist aus scipy.stats verfügbar.

Diese Übung ist Teil des Kurses

Hypothesentests in Python

Kurs anzeigen

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Calculate the pooled estimate of the population proportion
p_hat = ____

# Print the result
print(p_hat)
Code bearbeiten und ausführen