Test von zwei Proportionen
Du fragst dich vielleicht, ob der für die Fracht gezahlte Betrag Einfluss darauf hat, ob die Sendung verspätet war oder nicht. Erinnere dich daran, dass im Datensatz late_shipments
in der Spalte late
gespeichert ist, ob die Sendung verspätet war oder nicht. Die Frachtkosten werden in der Spalte freight_cost_group
gespeichert, und die Kategorien sind "expensive"
und "reasonable"
.
Die zu testenden Hypothesen, wobei "late"
dem Anteil der verspäteten Sendungen für diese Gruppe entspricht, sind
\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)
\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)
p_hats
enthält die Schätzungen der Grundgesamtheitsanteile (Stichprobenanteile) für jede freight_cost_group
:
freight_cost_group late
expensive Yes 0.082569
reasonable Yes 0.035165
Name: late, dtype: float64
ns
enthält die Stichprobengrößen für diese Gruppen:
freight_cost_group
expensive 545
reasonable 455
Name: late, dtype: int64
pandas
und numpy
wurden unter ihren üblichen Aliasnamen importiert, und norm
ist aus scipy.stats
verfügbar.
Diese Übung ist Teil des Kurses
Hypothesentests in Python
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Calculate the pooled estimate of the population proportion
p_hat = ____
# Print the result
print(p_hat)