Test su due proporzioni
Potresti chiederti se l'importo pagato per il trasporto incida sul fatto che la spedizione sia arrivata in ritardo o meno. Ricorda che nell'insieme di dati late_shipments, l'informazione sul ritardo della spedizione è nella colonna late. I costi di trasporto sono nella colonna freight_cost_group, con categorie "expensive" e "reasonable".
Le ipotesi da testare, dove "late" corrisponde alla proporzione di spedizioni in ritardo per quel gruppo, sono
\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)
\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)
p_hats contiene le stime delle proporzioni della popolazione (proporzioni campionarie) per ciascun freight_cost_group:
freight_cost_group late
expensive Yes 0.082569
reasonable Yes 0.035165
Name: late, dtype: float64
ns contiene le dimensioni campionarie per questi gruppi:
freight_cost_group
expensive 545
reasonable 455
Name: late, dtype: int64
pandas e numpy sono stati importati con i soliti alias e norm è disponibile da scipy.stats.
Questo esercizio fa parte del corso
Test di ipotesi in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate the pooled estimate of the population proportion
p_hat = ____
# Print the result
print(p_hat)