Test von zwei Proportionen
Du fragst dich vielleicht, ob der für die Fracht gezahlte Betrag Einfluss darauf hat, ob die Sendung verspätet war oder nicht. Erinnere dich daran, dass im Datensatz late_shipments in der Spalte late gespeichert ist, ob die Sendung verspätet war oder nicht. Die Frachtkosten werden in der Spalte freight_cost_group gespeichert, und die Kategorien sind "expensive" und "reasonable".
Die zu testenden Hypothesen, wobei "late" dem Anteil der verspäteten Sendungen für diese Gruppe entspricht, sind
\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)
\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)
p_hats enthält die Schätzungen der Grundgesamtheitsanteile (Stichprobenanteile) für jede freight_cost_group:
freight_cost_group late
expensive Yes 0.082569
reasonable Yes 0.035165
Name: late, dtype: float64
ns enthält die Stichprobengrößen für diese Gruppen:
freight_cost_group
expensive 545
reasonable 455
Name: late, dtype: int64
pandas und numpy wurden unter ihren üblichen Aliasnamen importiert, und norm ist aus scipy.stats verfügbar.
Diese Übung ist Teil des Kurses
Hypothesentests in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the pooled estimate of the population proportion
p_hat = ____
# Print the result
print(p_hat)