1. Learn
  2. /
  3. Courses
  4. /
  5. Testarea ipotezelor în Python

Connected

Exercise

Testul a două proporții

Poate te întrebi dacă suma plătită pentru transport influențează sau nu întârzierea unei livrări. Reamintește-ți că în setul de date late_shipments, informația privind întârzierea livrării este stocată în coloana late. Costurile de transport sunt stocate în coloana freight_cost_group, iar categoriile sunt "expensive" și "reasonable".

Ipotezele de testat, unde "late" corespunde proporției livrărilor întârziate pentru fiecare grup, sunt:

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats conține estimările proporțiilor populației (proporțiile eșantionului) pentru fiecare freight_cost_group:

freight_cost_group  late
expensive           Yes     0.082569
reasonable          Yes     0.035165
Name: late, dtype: float64

ns conține dimensiunile eșantionului pentru aceste grupuri:

freight_cost_group
expensive     545
reasonable    455
Name: late, dtype: int64

pandas și numpy au fost importate cu aliasurile lor obișnuite, iar norm este disponibil din scipy.stats.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Calculează proporția eșantionului combinat, \(\hat{p}\), folosind p_hats și ns.

$$ \hat{p} = \frac{n_{\text{expensive}} \times \hat{p}_{\text{expensive}} + n_{\text{reasonable}} \times \hat{p}_{\text{reasonable}}}{n_{\text{expensive}} + n_{\text{reasonable}}} $$